网络微短剧用户需求挖掘研究——基于LDA主题与Kano模型
Research on User Demand Mining of Network Short Drama—Based on LDA Theme and Kano Model
DOI: 10.12677/AAM.2022.118624, PDF, HTML, XML, 下载: 456  浏览: 3,683 
作者: 李佳欣, 田书格*:上海工程技术大学管理学院,上海
关键词: Kano模型网络微短剧数据挖掘用户需求分析LDA模型Kano Model Network Short Drama Data Mining User Demand Analysis LDA Model
摘要: [目的/意义]:通过分析热门网络微短剧在线评论内容,挖掘用户对该产品的深层次多元需求,有利于改进产品质量与探寻产品未来发展方向,促进处于成长期的产品健康可持续发展。[方法/过程]:通过Python爬取快手小剧场、腾讯“十分剧场”、B站小剧场热门视频评论,结合LDA主题聚类和Kano两种用户需求研究模型,获取用户需求,并对其进行质量类别归类和计算满意度,最终对结果进行讨论分析。[结果/结论]:文章中16项需求,11项是无差异需求,4项魅力需求,一项反向需求,对于魅力需求需要优先重点关注,部分无差异需求值得追踪挖掘,及时摒弃反向需求。
Abstract: [Objective/Significance]: By analyzing the online comments of popular online mini-dramas, the deep-seated diversified demands of users for this product can be tapped, which is conducive to im-proving the product quality, exploring the future development direction of the product, and pro-moting the healthy and sustainable development of the product in the growing period. [Meth-od/Process]: The popular video reviews of Kwai Theater, Tencent’s “Ten Theater” and bilibili Thea-ter were crawled by Python, combined with LDA topic clustering and Kano’s two user demand re-search models, to obtain the user demand, classify its quality category and calculate its satisfaction, and to discuss and analyze the results. [Result/Conclusion]: There are 16 demands in the article, 11 of which are undifferentiated demands, 4 attractive demands, and 1 reverse demand. Attractive demands need to be given priority attention, and some undifferentiated demands are worth tracing and mining, and the reverse demand should be abandoned in time.
文章引用:李佳欣, 田书格. 网络微短剧用户需求挖掘研究——基于LDA主题与Kano模型[J]. 应用数学进展, 2022, 11(8): 5923-5935. https://doi.org/10.12677/AAM.2022.118624

1. 引言

随着人们观看视频的方式逐渐由传统电视转向移动端,以及疫情防控常态化下居家办公学习成为一种趋势,网络微短剧从传统长视频、短视频、短剧中脱颖而出,成功锁定受众时间,迎来井喷式发展。根据2021年网络视听发展研究报告,截至2020年12月,微短剧等“微系列”产品成为长短视频平台的重点发展方向 [1]。快节奏的生活、碎片化的时间催生出网络微短剧这个拥有短视频的“型”及紧凑剧情的综合性互联网内容产品,并且相较于出现更早的短剧在单集时长和总集数上变得更为短小。一方面,网络微短剧成为各大长短视频平台争夺流量的新切口,另一方面,作为成长期的互联网产品,如何带来持续的影响力及打造核心竞争力,以避免短期内被淹没在其他迭代新产品的浪潮中是网络微短剧当下亟需解决的问题。互联网新产品如何在“机”与“危”中把握平衡、寻找突破是用户需求研究领域的研究热点之一,文章基于此,挖掘网络微短剧用户隐性需求,寻求成长期的产品健康可持续发展之道。

2. 相关研究回顾

2.1. 网络微短剧研究现状及意义

根据Netfilx公司在短剧投入成本上的大数据算法结果以及国内网络微短剧上的相关研究、政策,文章将网络微短剧定义为:总集数控制在30集以内 [2],单集时长控制在10分钟以下,以竖屏、横屏、互动剧等方式在移动或者网页端呈现的,集剧情化的短视频与迷你化的网络剧特征为一体的互联网内容产品 [3]。目前学界对网络微短剧的研究集中在以下3点:① 叙事策略研究。张智华指出了中国一些网络短剧在叙事上的优缺点,叙事简明扼要、采用现实主义手法以及表现寻常百姓生活是其当前的优势所在,但是叙事内容和水平上较为欠缺 [4];杨红彬认为网络短剧的叙事紧凑、悬念丛生以及手法鲜明 [5]。② 问题及发展策略研究。尤达从当前网络微短剧的核心矛盾出发,提出融合、填补和交互三种策略 [3];朱天认为目前我国网络微短剧存在商业模式不明、内容品质不高等诸多问题,还难以成为真正的内容风口,但是其背后体现着的多元主体需求存在研究价值 [6]。③ 应用研究。Jun Shao等利用迷你剧进行旅游目的地营销,并研究其成功的影响因素 [7];吴迁基于腾讯yoo视频,利用网络微短剧探寻我国未来电视媒体的创新玩法 [8]。

综上,目前在微短剧研究领域,缺少用户需求方面的定量研究,而用户评论文本数量大,具有客观性,可获得性也高,适合用来对用户需求进行量化分析,根据用户满意度指数及需求类别提出优化发展的方向,更好地开拓微短剧市场,为该匹内容产品“黑马”持续健康发展服务。

2.2. 用户需求相关研究模型与理论

用户需求研究主要包括用户需求信息的获取、计算用户需求权重、用户需求归类以及转化需求生成方案等。KJ法、问卷法等可以均可以获取用户需求信息 [9];胡珊等在产品设计方案决策中,利用熵权法决定各评价指标权重,得出客观结果,决定最佳方案设计 [10],Mohd. Nazim等将模糊AHP法与模糊TOPSIS法进行对比,发现后者在电脑软件需求决策中更优,在需求权重计算上更精确 [11];Shwetank Avikal等通过Kano模型分析,以客观定量的方式来识别用户需求类型 [12],Censydiam用户动机模型是一种细致的以定性的方式来分析用户需求类型的模型,王立培用其挖掘阅读推广中用户隐性需求类型 [13]。

文章基于前人的研究,对网络微短剧用户需求进行归类,由于Kano模型在产品需求分类上较为广泛运用,文章以Kano问卷的形式从质量要素角度对用户需求进行分析。

3. 研究方案设计

3.1. 预调研

在正式确定研究对象前,笔者通过“虚拟民族志法”,深入快手小剧场、腾讯“十分剧场”、B站小剧场,统计各自热门微短剧top 10的题材类型,根据三个平台自带分类标签进行分类统计,标出热度排名前三的题材类型,具体如表1

Table 1. Statistics of drama types of each platform

表1. 各平台剧集类型统计

时间截至2022年5月8日。

由表可见现代甜宠、古风和悬疑探案稳居热度题材前三,文章将对这三类题材的相关剧集进行评论文本爬取,作为后文的数据来源之一。

3.2. 研究对象与模型选择

根据前文预调研的结果,文章分别在短视频、传统长视频及弹幕视频三种视频头部平台,对应选取快手小剧场、腾讯“十分剧场”、B站小剧场综合热度排名前三的微短剧题材(现代甜宠、古风和悬疑探案)对应的部分剧集视频评论作为研究对象,基于不同热门题材探究用户对网络微短剧关注的差异,挖掘用户多元深层次需求要素,促进后期发展对产品进行改进。

文章利用LDA模型对文本数据进行主题挖掘。LDA模型是一个用于处理文本数据集的非监督学习模型,服从狄利克雷先验分布,模型中最关键的是Drichlet分布α和β,这两个分布确定,模型即可确定。模型建立了文档–主题–词的三层概率结构,即主题可由词汇分布来表示,而文章可由主题分布表示 [14]。一篇文档生成方式有四步:① 从Drichlet分布α中取样生成文档i的主题分布 θ i ;② 从主题多项式分布 θ i 中取样生成文档i第j个词的主题 Z i , j ;③ 从Drichlet分布β中生成主题 Z i , j 对应的词语分布 ϕ Z i , j ;④ 从词语的多项式分布 ϕ Z i , j 中抽样生成词语 W i , j 。具体网络结构如下图1

Figure 1. LDA model generation process

图1. LDA模型生成过程

文章通过Kano模型探求网络微短剧用户需求。Kano模型是基于心理学建模的用户需求研究方法,通过Kano问卷的方式研究用户对产品的隐性需求,该模型源于日本质量管理专家Noriaki Kano于1984年建立的关于产品质量特性与用户满意度的双维度的认知模型 [15]。模型中五个质量要素分别为必备、魅力、期望(一维)、反向和无差异属性。解释如下:① 必备属性:是产品必须具备的属性,若产品不提供,则用户满意度会极大降低,而反之提升该属性,用户的满意度并不会随之提高;② 魅力属性:产品不提供该属性并不会引发用户不满,而提供则会给用户带来惊喜,大大提升用户满意度;③ 期望属性:产品提供该属性与用户满意度呈正比关系;④ 反向属性:产品提供该属性则会引发用户不满、厌恶的情绪;⑤ 无差异属性:用户对该属性无明显反应,提供与否满意度不受影响。具体模型详见图2

3.3. 研究思路

文章主要包含用户需求获取、用户需求分析归类及结果讨论分析。在正式爬取数据前,文章做了预调研,确定爬取数据的具体类别,快手、腾讯评论利用python爬取,B站评论文本直接通过网络爬虫工具“八爪鱼采集器”获得;LDA主题聚类分析和Kano问卷调查是文章的核心;最终将获得的数据整理归类,讨论结果并提出网络微短剧未来的优化、发展方向,具体如图3所示。

Figure 2. Kano model [16]

图2. Kano模型 [16]

Figure 3. Research ideas

图3. 研究思路

4. 数据处理与分析

4.1. 基于LDA主题模型的用户需求挖掘

文章基于预调研结果,通过“八爪鱼采集器”及Python爬虫从腾讯、快手和B站获取2022年2月至2022年四月的原始样本数据共22,848条,经过数据清洗,删除无意义符号表情、占楼语等,最终样本数分别为古风1697条,现代甜宠1872条,悬疑1617条,并对这些内容进行jieba分词,构建停用词表进行分析。

文章利用LDA主题模型识别文本预料中潜藏的用户需求,综合考量困惑度和相关性指标,设置主题数为5。文章以悬疑探案类微短剧为例,进行pyLDAvis可视化主题聚类,具体如图4。参数λ在[0, 1]之间,调节词语与主题的关联度,文章选取λ = 1,即文章出现频数较高的词与主题越相关,反之越特殊的词与主题相关度越高。可视化图中,任意选择一个主题,均会出现与该主题相关度最高的30个关键词。

Figure 4. Clustering visualization of suspense case online review topics

图4. 悬疑探案类在线评论主题聚类可视化

综合三种类型微短剧评论主题可视化聚类结果,生成表2,即每个类型的五个主题分别对应的top 5关键词综合表。从表中内容总结抽象出对应的用户需求,制作成图5,不同类型微短剧特征词与用户需求映射关系图。从中可得,由表2抽象出了6个用户需求,分别是用户对题材内容、主角选择、服化道、后期视频处理、IP来源和视频呈现形式六类总需求。每类总需求对应着关联度最大的几个特征词,以此为基础,展开Kano问卷设计。

Table 2. Themes and top 5 keywords

表2. 主题与top 5关键词

Figure 5. Feature word-demand mapping relationship

图5. 特征词–需求映射关系

4.2. 基于Kano模型的用户需求分析

4.2.1. 问卷设计

总问卷有两个部分,第一个部分为网络微短剧用户基本信息调查;第二部分是Kano问卷,为本问卷核心,设问项基于表3的16种特征要素及具体说明,表3是LDA主题分析结果的具体化呈现。Kano问卷的设问形式有正反两个方面,以要素1为例,正向设问为“如果网络微短剧提供泛娱乐化题材的剧集,如甜宠、悬疑类,你感觉如何?”,反向设问为“如果网络微短剧不提供泛娱乐化题材的剧集,如甜宠、悬疑类,你感觉如何”,每一个问题设置不喜欢到喜欢5种情感倾向,基于正反设问及5种情感倾向,针对某一需求要素提问的所有回答的组合如表4所示。问卷主要通过问卷星平台发放,发放周期为5月29号到6月17日,共收回问卷249份,其中有效问卷227份,有效率为91.16%。

Table 3. Classification of main demand characteristics of network short plays

表3. 网络微短剧主要需求特征分类

Table 4. Kano evaluation form [15]

表4. Kano评价表 [15]

表中M、O、A、I、R、Q分别代表基本质量,期望质量,魅力质量,无差异质量,反向质量以及矛盾、有问题的回答。

4.2.2. 基于Kano问卷的数据处理与分析

文章采用Cronbach’s Alpha系数来检验李克特量表信度,利用SPSS 23.0检验Kano问卷各部分的信度和效度。克隆巴赫α系数在(0.7, 0.9]之间认为是很可信,KMO值大于0.5表示问卷适合做因子分析,以及Bartlett球形度检验中的显著性值小于0.05表示数据之间具有相关性,适合进行因子分析 [17]。Kano总体问卷信度、正反向问题的Cronbach’s α系数均在0.8以上,表明问卷内容很可信,三个KMO值均在0.8以上,以及球形度检验均显著。综上表明问卷信度和效度均通过检验,可以进行后续数据分析,具体情况如表5所示。

Table 5. Reliability and validity test

表5. 信、效度检验

根据表4评价表,对网络微短剧Kano问卷结果进行汇总,依据“最大频数法”对质量特性进行归类 [16]。从表6可以看出,微短剧的16个具体需求中,除了6——服装配饰、7——道具、8——妆效、16——沉浸式互动归属A类,以及10——人物美颜归属R类外,其他11种均归属I类。文章认为,魅力质量是如果网络微短剧具备这些特征,用户会感到惊喜,会大大提高他们的满意度,而不提供,也不会降低其满意度;反向质量即网络微短剧如果具备这些特征要素,则会使用户感到不满厌恶,从而降低其满意度;至于无差异质量,说明网络微短剧具不具备这些特征,均不会影响用户满意度,用户更多是以一种无所谓的态度对待这些要素的;疑问因子频数总体较低,证明了问卷调查的有效性。结果说明,文章的调查对象对微短剧是否具备文章提及的大部分特征要素并不关心,而少部分特征会激起他们的兴趣或者使之反感。

Table 6. Classification of Kano questionnaire survey results of characteristic elements of online mini dramas

表6. 网络微短剧特征要素Kano问卷调查结果归类

5. 结果讨论

文章利用better-worse散点图计算用户满意度指数,有利于确定用户需求供给的重点和优先级。用户满意度指数是通过A、M、O、I四个质量类别的频数计算得出,公式为:

Better = ( A + O ) / ( A + M + O + I ) (1)

Worse = ( O + M ) / ( A + M + O + I ) (2)

Better系数取值在[0, 1]之间,越是接近1,则该要素具备度越高该需求对用户满意度提升的影响效果越大,Worse系数取值在[−1, 0]之间,表示不提供某功能或不具备某特征要素后,用户满意度会降低,负值越接近−1,用户满意度降低效果越强,满意度下降也越快 [18]。文章以Better值为横轴,Worse值的绝对值为纵轴,两者平均值为图中横纵坐标交点,绘制散点图,将图分为四个象限,第一象限的Better值和Worse的绝对值都在均值以上,第三象限与之相反,具体如图6,并基于图6表6绘制表7,即用户满意度指数分类结果汇总表:

Figure 6. Better-worse scatter

图6. Better-worse散点图

Table 7. Classification and summary of satisfaction index

表7. 满意度指数分类汇总

1) 魅力需求要素应重点关注,优先考虑

魅力质量要素出现在第一和第四象限。第一象限中的Better值与Worse绝对值均在平均水平以上,要素集中在魅力要素上,魅力要素的质量及提供与否显著影响用户满意度;在第四象限Better值高于平均水平,Worse的绝对值低于平均水平,即提升第四象限中的要素质量有利于提升用户满意度但是对降低用户不满影响较小。第一象限和第四象限涉及的魅力要素分别是服装配饰、道具、妆效及沉浸式互动,即魅力要素集中于微短剧呈现的服化道和呈现形式上。这四项魅力要素中,要素16有最大的Better值,要素8有最大的−Worse值:网络微短剧打造平台应积极打造互动型多玩法微短剧,且截至6月25日,在爱优腾三大头部传统长视频平台只有优酷的短剧剧场拥有互动短剧并为其单独分类,短视频头部平台抖音、快手主打竖屏微短剧以及B站互动玩法集中于互动游戏,即积极打造互动型、由用户主导剧情走向的微短剧可以有效提高用户对微短剧的使用满意度,互动型微短剧拥有较大发展空间;此外,平台在未来打造微短剧时要提升演员的化妆效果,使其符合自己的角色身份并与剧本环境适配,可有效降低用户观看的不满意度。比如文章爬取数据来自的三个热门微短剧类型,甜宠、古风和悬疑,在后两者中妆效的重要度更为突出,在非架空朝代中,古风微短剧人物妆效需要和时代相应,尊重最基本的史实及大众对古风妆容美学的需求;悬疑剧中经常有特效妆的需求,特效妆效果如果不到位,会使画面显得廉价违和。因此,打造微短剧的平台、企业需要重点优先关注微短剧的魅力要素,以提升用户的惊喜、满意度。狩野纪昭通过调查证实了质量要素的演变路径是由魅力要素到期望要素再到基本要素 [19]。文章按照此规律推断,这些魅力要素会逐渐向基本质量演变,也是一种警戒的信号,因此平台在投资这些要素时也要不断关注用户的偏好转向和其他反馈。

2) 追踪挖掘无差异需求

无差异需求对提高或降低用户满意度的效果均较弱,文章中有11项要素为无差异需求,并且遍布四个象限,文章将无差异需求再分为两类,第一类无差异需求即为第三象限中的五个无差异需求,涉及微短剧主角选角和IP来源两部分。由于第三象限的数据特点是Better和Worse绝对值均在平均值以下,文章的调查对象对此关注度也较低,笔者认为平台在主角选角和IP来源上无需投入过多的资金和后续追踪,一方面主角选角上无论是素人还是明星演员,对于一个十分钟以内的视频,演员演技佳、情感表达到位更重要,更能给观众带来感情和表现力上的冲击和记忆点,现阶段,如果大量投资资金在主角上,比如请流量明星,极大可能造成收益远不及成本的结果;另一方面,IP来源上无论是自制还是来源一些现成网络文学的改编,都不及剧本内容为独立创作、无版权纠纷且具有创意重要。无差异需求的第二类除了一、二、四这三个象限中的五个要素,还有第三象限中的14——竖屏剧,前五个要素有共同的特点:在Better和−Worse值中至少有一个值在均值以上,即这五个要素在提升用户满意度或降低用户不满上至少有一方面有显著的效果。产品或者服务的最高目标是创造魅力质量,挖掘用户隐性需求,而质量属性是会随着时间和用户需求的改变而动态变化的,笔者认为当下的无差异需求现实主义等题材、原声配音和以横屏精品剧形式呈现微短剧等将会是未来的魅力要素的源泉,是值得企业追踪和挖掘的用户隐性需求。

3) 摒弃反向需求

根据数据结果,16个要素中有一个反向需求,反向需求在产品需求分析中被认为是多余的功能和服务,提供了会引起用户强烈不满、急剧降低满意度水平,许多用户并没有此需求。将10——人物美颜联系实际分析,近年在传统的长剧集中,平台喜欢在后期制作上给剧集中的人物加美颜滤镜、磨皮等特效,使观众看不清演员的肌肤纹理,演员五官夸张变形,偏离主流审美,长剧集因为时间长一定程度上可以弱化不当美颜功能带来的用户负面情绪,但是微短剧只有短短几分钟,更多的镜头聚焦于主演人物,这种情况下美颜、磨皮、美白等特效的不当使用会极大影响微短剧用户的观感,引起不满、排斥等负面情绪。微短剧内容制作需要匠人精神,“一键美颜”等偷工减料的行为只会产生失败的作品。

6. 结语

文章从不同平台爬取热门网络微短剧在线评论,从中挖掘用户评论主题及关于微短剧的特征词,通过特征与需求的结构映射归纳出16种用户需求要素。基于此,利用Kano调查问卷获得用户对微短剧16种需求特征满意度感知,进行数据处理后,通过需求归类汇总表、四象限散点图对结果进行归纳讨论,确定产品需求供给的重点及优先级。根据讨论结果,可以发现网络微短剧优化方向:第一:网络微短需要不断打磨自己的服化道,力求精致与适宜,摒弃与其他微短剧相近相似的造型布景,寻求差异化发展;第二:充分挖掘潜在用户,多平台发展,加强宣发效果,打造下沉市场,并追踪用户的需求变化趋势;第三:微短剧作为一种成长期的产品,需要加快技术革新的脚步,不断完善微短剧呈现的形式,开发出除竖屏、互动剧之外的其他形式的微短剧,打造能激发用户惊喜的功能,才能满足用户的隐性需求;第四:通过大众口碑引导,增强微短剧用户粘性,增加用户使用的频率和场景,使网络微短剧成为日常生活的一部分。

文章利用多元数据从定量分析的角度研究网络微短剧用户需求,有效克服网络微短剧定性分析中需求来源的可靠性、主观性问题。此外,微短剧作为一种综合体,后续研究可将其从量化的角度与短视频、传统长视频进行需求对比分析,进行改进深化。

NOTES

*通讯作者。

参考文献

[1] 中国网络视听节目服务协会. 2021中国网络视听发展研究报告[EB/OL].
https://www.cnsa.cn/attach/0/2112271351275360.pdf, 2022-03-15.
[2] 郑华平, 胡盈盈. 台网联动效应下精品短剧的破圈传播——以“芒果季风”剧场为例[J]. 中国电视, 2021(12): 16-19.
[3] 尤达. 短视频剧情化与网络剧迷你化——网络微短剧精品化发展的迷思与探索[J]. 中国电视, 2022(3): 75-82.
[4] 张智华, 毛佩琦. 论2016年中国部分网络影视短剧叙事与视听[J]. 中国电视, 2018(1): 88-91.
[5] 杨红彬. 网络短剧的发展图志与内容构建[J]. 当代电视, 2020(8): 91-94.
[6] 朱天, 文怡. 多元主体需求下网络微短剧热潮及未来突破[J]. 中国电视, 2021(11): 63-68.
[7] Shao, J., Li, X., Morrison, A.M. and Wu, B. (2016) Social Media Micro-Film Marketing by Chinese Destinations: The Case of Shaoxing. Tourism Management, 54, 439-451.
https://doi.org/10.1016/j.tourman.2015.12.013
[8] 吴迁. 微短剧: 短视频的创新及其对电视媒体的启发——基于腾讯yoo视频的分析[J]. 传媒, 2019(22): 54-57.
[9] 杨晓宏, 郝照, 周海军, 周效章, 李运福. 基于质量功能展开(QFD)的高校在线开放课程教学质量认定标准研究——高校在线开放课程价值主体需要分析[J]. 中国电化教育, 2019(6): 108-113+130.
[10] 胡珊, 刘晶. 模糊综合评价法在产品设计方案决策中的应用[J]. 机械设计, 2020, 37(1): 135-139.
[11] Nazim, M., Wali Mohammad, C. and Sadiq, M. (2022) A Comparison between Fuzzy AHP and Fuzzy TOPSIS Methods to Software Requirements Selection. Alexandria Engineering Journal, 61, 10851-10870.
https://doi.org/10.1016/j.aej.2022.04.005
[12] Avikal, S., Singh, R. and Rashmi, R. (2021) QFD and Fuzzy Kano Model Based Approach for Classification of Aesthetic Attributes of SUV Car Profile. Journal of Intelligent Manufactur-ing, 31, 271-284.
https://doi.org/10.1007/s10845-018-1444-5
[13] 王丽培. 阅读推广工作中用户隐性信息需求挖掘研究——基于Censydiam模型[J]. 信息管理与信息学, 2019(4): 69-73+97.
[14] 史昀嘉. 基于LDA主题模型的新浪微博用户兴趣研究[D]: [硕士学位论文]. 济南: 山东大学, 2020.
[15] 涂海丽, 唐晓波. 微信功能需求的KANO模型分析[J]. 情报杂志, 2015(5): 174-179.
[16] 李贺, 曹阳, 沈旺, 李叶叶, 涂敏. 基于LDA主题识别与Kano模型分析的用户需求研究[J]. 情报科学, 2021(8): 3-11+36.
[17] 朱小东. 移动短视频产品高学历用户使用意愿影响因素研究报告[D]: [硕士学位论文]. 南京: 南京大学, 2020.
[18] 邢畅, 肖雪, 韩丽. 基于Kano模型的高校新生适应阶段信息需求分析[J]. 图书馆工作与研究, 2021(11): 18-26+62.
[19] Kano, N., Seraku, N., Takahashi, F. and Tsuji, S. (1984) Attractive Quality and Must Be Quality. The Journal of Japanese Society for Quality Control, 14, 147-156.
https://doi.org/10.20684/quality.14.2_147