1. 引言
移动技术的快速发展和智能手机等移动设备的广泛使用,使得移动健康成为随时随地为患者提供在线健康咨询服务的重要因素[1]。移动健康App是基于移动通信技术的第三方医疗健康模式,作为在线咨询的重要手段,提供医疗健康相关内容,以促进诊断和疾病预防[2]。移动健康App不仅为临床医生提供了便捷的医疗知识和患者数据获取,还提高了患者医疗服务的可获得性,在一定程度上优化了优质医疗资源的配置,对提高医疗服务的效率和便利性、改善人们健康状况、缓解医患矛盾等方面具有重要作用[3]。
移动健康App为广大用户提供了一种新的医疗咨询方式,用户对移动健康App的满意度直接反映了用户对移动健康服务的认可程度。目前,衡量移动健康App用户满意度的研究正变得越来越频繁,传统的定性、定量或混合方法(例如焦点小组、问卷调查或两者的结合)通常被研究人员用作识别和测量用户满意度维度的信息源[4] [5] [6]。然而,这些方法既耗时又不准确。例如,并不是所有的客户都认真对待问卷调查,许多客户随机填写问卷,这给分析带来了噪音。此外,问题通常是根据之前的研究设置的,这损害了问卷中未考虑到的主题的揭示,例如,新兴的客户偏好[7]。来自不同领域的研究表明,用户生成内容(UGC)可以作为了解用户偏好和需求的信息源[8]。移动健康应用的用户数量正在增加,一些用户愿意通过应用商店对移动健康应用进行反馈和评论,评论的内容可能包括用户体验和应用程序的功能需求,比如用户对应用是否满意、期望的改进和潜在的需求、是否愿意推荐给别人,甚至是应用存在的问题[9]。因此,分析用户评论有助于了解移动健康App是否真的能满足人们的需求,用户是否真的对医疗行业提供的这些医疗应用感到满意。故本文对移动健康App用户评论进行文本挖掘和情感分析,帮助软件开发人员探索用户对软件的功能需求及满意度,提高软件竞争力和用户粘性。
2. 研究框架和方法
用户满意度是个人对医疗保健多个方面的评估,基于众多维度的权重和由此产生的情感或态度[10]。本研究以医疗类移动健康App用户评论数据为基础,运用文本挖掘方法识别移动健康应用评论维度,计算用户对移动健康应用不同维度的关注度以及用户对每个维度的满意度。本文首先通过词云图和word2vec识别影响用户满意度的因素,同时结合词云图和word2vec的分析结果,对所有评论文本中的高频名词进行归类以构建移动健康App评论维度特征词表。然后基于分隔符切分所有用户评论文本,并与所构建的移动健康App评论维度特征词表进行匹配,将切分后的文本分类至不同特征类别中。最后,结合维度特征词表的词频计算各维度的权重,并使用SnowNLP库的情感分析功能获取用户对每一维度的情感分值。模型总体结构如图1所示,包括数据搜集与预处理、评论维度特征抽取、评论切分与分类、维度权重计算和情感分值计算五个部分。
Figure 1. Research framework
图1. 研究框架
2.1. 维度权重计算
不同用户使用移动健康应用程序的目的不同,这可能会导致每条用户评论的重点不同,评论中对每个维度的关注也会不同,因此每个评论可能包含多个维度。故本文基于识别的用户满意度维度特征词表与所有评论短句的分类结果,计算用户对不同维度的权重。具体计算步骤如下:
1) 计算每一维度特征词的权重。将包含特征词
的评论短句数占所有评论短句数的比值作为特征词
的权重,计算方法如公式(1)所示。
(1)
其中,
为包含特征词
的评论短句数量,m为App用户满意度特征维度总数,
为特征维度i所包含的特征词总数。
2) 计算每一维度的权重。将维度
包含的所有特征词的权重之和作为维度
的权重,计算方法如公式(2)所示。
(2)
2.2. 基于SnowNLP的维度情感分值计算
维度情感分值是指移动健康App在一个特征维度上的情感得分,是对所有用户评论进行切分与分类后,将同一维度特征下的所有评论文本输入SnowNLP库中进行情感分析,从而计算出用户对移动健康App此维度的情感分值。
SnowNLP是一款基于Python的中文自然语言处理库,具有较高的准确性和性能,其主要特点之一是强大的情感分析功能。通过SnowNLP对中文文本进行情感分析,可以准确判断文本的情感倾向,包括积极、消极和中性[11]。
为了评估SnowNLP情感分析的准确性,本文从用户评论文本中随机选取了1000条评论数据,包括评论文字(用comment表示)和用户评论星级(用star表示)。数据集的star列有1~5分,本文把star分数大于3的表示积极情感(用数字1表示),小于3的表示消极情感(用数字0表示),列名以sentiment表示。然后,向jupyter中导入第三方SnowNLP库,用于对文本进行情感分析。SnowNLP输出结果范围在[0, 1]之间,越接近1表示正面情绪越强烈,越接近0表示负面情绪越强烈。本文定义大于0.6为积极,返回值为1,否则返回值为0,表示消极,列名以snownlp-sentiment表示。最后,将SnowNLP分析得到的结果(snownlp-sentiment列)与事先经过标签处理过的计算结果(sentiment列)进行匹配,相等的则计数,再除以总样本,最后得出SnowNLP情感分析准确率为0.831,准确率达到较高水平,因此有理由认为基于SnowNLP的情感分析方法在计算用户评论短句情感分值时具有一定的有效性与准确性。
因此针对每个维度,利用SnowNLP().sentiments函数计算每个评论短句的情感分值,对每一维度下的所有评论短句的情感得分求均值,得到每个维度的情感分值。具体的计算方法如公式(3)所示。
(3)
其中,
表示评论短句c的情感得分;
表示第i个维度下包含的评论短句总数。
3. 实证分析
3.1. 数据搜集与预处理
七麦数据是一家专业的移动应用数据分析平台,它覆盖了全球范围内的移动应用市场,涵盖了各种类型的应用程序,拥有庞大的移动应用数据资源,包括应用程序的用户评论[12]。因此本文从七麦数据上下载了App Store上2019~2023年春雨医生、微医和好大夫在线三个医疗类移动健康应用程序的用户评论数据,下载的数据只保留标题和内容两列数据,共下载到14,231条用户评论数据。下载的部分数据如图2所示。
Figure 2. A partial display of mobile health App user reviews
图2. 移动健康App用户评论部分展示
原始用户评论数据通常存在着噪声、不一致性和非结构化等问题,因此需要对数据进行预处理以提高数据质量和可用性。jieba作为一款开源的中文分词工具,具有高效、灵活和易用等特点[13]。本文数据预处理流程如下:首先使用Python自写代码将标题与内容两列数据合并为一列,替换原来的内容列数据,同时删除标题列。然后利用Python软件的replace()函数,使用正则表达式去除评论文本中的特殊字符、标点符号等所有非中文字符,以保留纯中文文本信息。最后利用jieba.posseg对评论文本进行分词和词性标注。jieba还支持用户自定义词典,可以根据具体的应用场景和需求,添加领域专用词汇,提高分词效果和准确性。本文根据研究样本,在jieba的自定义词典中添加了“微医”“好大夫在线”和“春雨医生”等词语。同时结合百度停用词表和哈工大停用词表进行去停用词处理,并结合样本数据,向停用词表中添加更多停用词,以达到有效过滤无用且无意义的词语,提高模型分词的准确率和语料的干净性。
3.2. 维度识别
为直观地展现出用户评论中所关注的焦点和主题,本文通过绘制词云图实现特征的可视化。对分词后的用户评论文本进行词频统计以生成词云图,如图3所示。
在图3中,存在着较多的积极评论特征词,如“不错”“很好”“好用”“推荐”等,表明多数用户对移动健康App的整体态度是积极的。此外,“耐心”“回复”“专业”“咨询”“挂号”和“态度”等特征词脱颖而出,说明用户在选择移动健康App以及接受移动问诊服务的时候,尤其看重医生的服务态度、医生的专业度及软件的便利性。值得注意的是,虽然在词云图中,“免费”“客服”“功能”“实用”“下载”和“知识”等词相对不突出,但它们反映了用户也看重移动健康App的易用性、费用和信息质量等方面。
Figure 3. Word cloud diagram
图3. 词云图
word2vec是一种流行的词嵌入方法,在自然语言处理中被广泛使用。它由一组相关的模型组成,这些模型能够将词语表示为固定长度的高维向量。这些向量旨在捕捉词语的语义内容和上下文关系,使得在向量空间中语义上相似的词语彼此靠近。word2vec有两种主要的训练架构:CBOW和Skip-gram。CBOW模型预测目标词基于上下文词语,而Skip-gram模型使用一个词来预测它的上下文[14]。由于CBOW在常用词的训练方面具有优势[15],因此本文使用CBOW结构训练用户评论文本,通过word2vec的输出帮助了解用户在评价移动健康App的医疗服务、软件产品和整体满意度时最看重的方面。由词云图可知,用户评论文本几乎都是围绕医生和软件这两个词语进行的,同时结合用户满意度研究主题,最终选择医生、软件和满意这三个词作为种子词语,利用Python软件导入Gensim库的word2vec模型计算用户评论语料中与医生、软件和满意最相似的前20个词语。结果如表1所示。
Table 1. Semantic similarity word analysis
表1. 语义相似词分析
与医生最相似的词语 |
与软件最相似的词语 |
与满意最相似的词语 |
相似词语 |
相似度 |
相似词语 |
相似度 |
相似词语 |
相似度 |
回复 |
0.989395261 |
很好 |
0.977626204 |
恢复健康 |
0.987386346 |
回答 |
0.989115775 |
经验 |
0.973764837 |
讲解 |
0.986106515 |
解答 |
0.987497687 |
推荐 |
0.969466329 |
平易近人 |
0.985331893 |
专业 |
0.984291136 |
免费 |
0.967853725 |
焦虑 |
0.984652162 |
细致 |
0.972631693 |
咨询 |
0.96784693 |
效果 |
0.98457104 |
细心 |
0.96186769 |
不错 |
0.967004836 |
好用 |
0.984317422 |
讲解 |
0.960852027 |
专业 |
0.964796245 |
服务态度 |
0.984197378 |
耐心 |
0.960506022 |
口碑 |
0.96479553 |
求助 |
0.983758748 |
解释 |
0.95502454 |
提问 |
0.962217331 |
安心 |
0.983403862 |
焦虑 |
0.950027406 |
速度 |
0.960846782 |
耗时间 |
0.982312918 |
很好 |
0.948685765 |
放心 |
0.957101762 |
面诊 |
0.982046962 |
经验 |
0.940145075 |
讲解 |
0.956233919 |
制定方案 |
0.980950713 |
软件 |
0.937943041 |
求助 |
0.955542028 |
权威性 |
0.980877578 |
建议 |
0.937769175 |
服务态度 |
0.955274701 |
超快 |
0.980653584 |
提问 |
0.932100832 |
好用 |
0.954783499 |
诊断 |
0.980127513 |
不错 |
0.92794919 |
焦虑 |
0.954702795 |
药物 |
0.979940057 |
满意 |
0.927702725 |
实用 |
0.953503013 |
电话沟通 |
0.979860783 |
摸索 |
0.927625358 |
问诊 |
0.950438678 |
细心 |
0.979381263 |
提出 |
0.91810739 |
白用 |
0.94921273 |
权威认证 |
0.979175806 |
求助 |
0.917740405 |
高效 |
0.947422564 |
摸索 |
0.979143739 |
从表1中可以看出,与医生高度相似的词汇如“回复”“回答”“解答”都与良好沟通相关。词汇“专业”“细致”和“细心”指向了医生的专业知识和对患者细节的关注,而“耐心”则反映了医生对待患者的态度。用户对软件的满意度往往与其易用性、费用和资源质量直接相关,如“很好”“好用”“免费”“经验”“口碑”。此外,用户在使用软件过程中的便利性也被认为很重要,如“咨询”“速度”“高效”。与“满意”相关的词汇表明用户在寻求服务或产品时不仅关注结果(如“恢复健康”“效果”),还关注过程(如“讲解”“服务态度”)。用户满意度与其体验的人性化和专业性紧密相连,如“平易近人”“安心”和“权威性”。
综合词云图和word2vec输出结果发现,用户提到最多的5个影响用户满意度的因素包括医生服务态度、便利性、资源质量、软件易用性和费用。周清清等[16]研究发现相较于常用的属性抽取方法(如基于情感词、结合人工的LDA等方法)来说,抽取高频名词作为候选属性词能够更加全面地识别更多细粒度的属性。因此,本文对预处理后评论文本中的所有名词进行词频统计,筛选出词频大于5的名词作为候选特征词,然后人工筛选去除与App满意度无关的候选特征词,将剩余候选特征词作为移动健康App满意度评价特征词。将候选特征词通过反复比较分析,结合词云图和word2vec的分析结果,最终将其归类为服务、便利、质量、使用和费用5个维度。结果如表2所示。
服务:主要包括用户对医生服务态度、响应速度及问诊效率等方面的评价。
便利:主要是指用户对软件及其特色功能等能够带给用户便利方面的评价,如网上挂号咨询、电话沟通、省时省力等。
质量:主要包括用户对软件上医生资源的专业性及软件提供的医疗健康信息的权威性和质量等方面的评价。
使用:主要包括用户对软件质量等方面的评价。如界面设计是否美观、个人信息是否安全、软件是否易于使用、使用过程中是否出现软件错误,如死机或闪回、兼容性、安装注册软件时遇到的问题等。
费用:主要包括用户对使用软件费用方面的评价,如软件设置的问诊费、购药运费、挂号费以及一些优惠活动等。
Table 2. Mobile health App dimension feature word table
表2. 移动健康App维度特征词表
维度 |
特征词 |
服务 |
态度、建议、细心、认真负责、交流、关心、责任心、平易近人、亲切感、制定方案、指点、效率高、补救措施、注意事项、对症、敬业精神、效果、速度、效率、团队、敬业、服务态度、解决问题、热情、等待时间、责任感、责任、解决方案、医嘱、用药 |
便利 |
咨询、挂号、功能、家庭医生、寻医问药、购药、咨询服务、线上问诊、号源、买药、加号、会员、电话沟通、监督、记录、远程、语音、服务、专家门诊、电联、电話、检查报告、检查、省时省力、节省、方便使用、省力、恢复健康、精准、节约、省心、省事、节省时间、居家、好帮手、自测、耐用度、助手、指导、智能、随身带、所在城市 |
质量 |
专业、专家、医术、经验、经验丰富、名医、信心、靠谱、权威性、信任度、资讯、信赖、权威认证、心安、专业性、信誉、技术、能力、定心丸、素养、小常识、专栏、医学知识、专业知识、实用信息、文章内容、资源、科学、科普知识、学会、文章、常识、内容、产品质量、商品 |
使用 |
客服、验证码、界面设计、短信、网络、人性化、优化、设置、功能模块、卡、账号、画面、后台、数据、实用功能、号码、个人信息、定位、手机号、版本、页面、设计、界面、售后、续费、档案、升级、身份证、手机号码、个性化、广告、小巧、账户、手机、分类 |
费用 |
免费、义诊、费用、性价比、价格、低价、坑、成本、优惠、实惠、收费、省钱、挂号费、价格合理、乱收费、优惠卷、服务费、运费、交钱 |
3.3. 评论切分与分类
考虑到一条用户评论可能会涉及多个维度,因此本文对每条用户评论进行切分,然后将每个评论短句分类到相应的维度。读取全部经过预处理的文本评论数据,根据语句中的分隔符(如“,”“。”“!”等)将每一条评论文本切分为多个短句,并将得到的评论短句集合与表1基于高频名词归类的不同维度下的特征词进行匹配,过滤掉不包含特征词的短句,留下的短句按其包含的特征词所属的维度进行分类存储。
3.4. 维度权重计算
通过对搜集到的评论进行观察,发现用户对移动健康App各个维度的关注程度不同。用户对移动健康App不同维度关注程度的高低反映了他们对于健康管理和移动应用不同维度体验的重视程度。因此,通过计算各个维度的权重来衡量用户对移动健康App不同维度的关注度。
基于公式(1)和公式(2)对搜集的用户评论数据进行权重计算,结果如表3所示。
Table 3. Different dimensions of mobile health App attention
表3. 移动健康App不同维度关注度
维度 |
所占权重 |
服务 |
0.2342 |
便利 |
0.3282 |
质量 |
0.2831 |
使用 |
0.0951 |
费用 |
0.0593 |
不同维度的权重充分反映了用户对于各项移动健康App使用体验的关注情况。由表3可以看出,“便利”是用户提及频率最高的维度,可见对于移动健康App来说,软件的便利有用性对用户情感感知的影响程度最大。“质量”维度的权重略高于“服务”,且在移动健康App评论中,用户经常提及应用的特色信息、医生专业性、服务态度等方面,体现了医生服务质量和资源质量也是影响用户满意度的重要因素。此外,用户对“使用”和“费用”两个维度的关注度相对较低,这体现了仅仅小部分用户对App界面设计、系统稳定性、软件易用性、问诊费用表现了关注度,说明大多数用户对移动健康App的错误率有较高的容忍度,以及多数用户认为移动健康App设置的费用是相对合理的。
为了观察用户对不同移动健康App各维度的关注度是否存在差异,本文对搜集的好大夫在线、微医和春雨医评论数据进行相同操作,并将各个维度的权重得分进行可视化展示,结果如图4所示。
Figure 4. Attention of different mobile health App by dimension
图4. 不同移动健康App各维度关注度
基于图4对三个移动健康应用进行比较分析发现,春雨医生和微医都在便利性方面获得了最高的权重,显示了用户对其提供的便捷医疗服务的高度关注,包括网上挂号、在线咨询等功能;且这两款App的质量维度高于服务维度,表明使用春雨医生和微医的用户相比医生的服务态度和响应速度,更在意医生的专业度和医疗信息的准确性。而好大夫在线则完全相反,好大夫在线在服务方面权重最高,表示用户对于好大夫在线App最关注医生的服务态度和问诊效率等方面;且其质量维度高于便利维度。三款App在使用和费用维度都获得了较低的权重。
综上所述,用户在选择医疗类移动健康应用时,更注重便利、服务和质量维度。因此,应用开发者应该注重提供便捷的医疗服务,并提升软件的服务质量和资源质量,如医生服务态度、响应速度、专业的医生资源和准确的医疗健康信息等,以满足用户的需求和提升应用的竞争力。
3.5. 维度情感分值计算
维度的情感分值,代表了大多数用户对于此维度的满意度程度。因此本文基于公式(3),对移动健康App的不同维度进行了情感得分计算,并将结果列在表4中。
Table 4. Sentiment scores for different dimensions of mobile health App
表4. 移动健康App不同维度情感分值
维度 |
情感分值 |
服务 |
0.7194 |
便利 |
0.6381 |
质量 |
0.7560 |
使用 |
0.4925 |
费用 |
0.5201 |
由表4可知,移动健康App在质量方面获得了最高的情感得分,为0.7560,表明用户对于移动健康APP上医生资源的专业度及其提供的医疗健康信息的权威性和质量持认可态度,用户相信移动健康App提供的医疗健康信息可靠且医生具有专业知识和技能。服务维度的情感得分略低于质量维度,为0.7194,表明用户对医生的服务态度、响应速度和问诊效率普遍持肯定态度。便利方面的情感得分为0.6381,得分相对较高,表示用户对于软件提供的功能,如网上挂号咨询、电话沟通等感到满意,认为这些功能能够为他们节省时间和精力,提供便利的就医体验。使用方面的情感得分为0.4925,略低于其他方面,可能意味着一些用户认为界面设计不够美观,或者在使用过程中遇到了一些软件错误或兼容性问题。费用方面的情感得分为0.5201,属于中等水平,表明用户对软件设置的问诊费、购药运费等方面的评价可能有所参差不齐,用户可能会根据个人情况和优惠活动等因素对费用有不同的看法。综合来看,用户整体对移动健康APP的评价较为积极,特别是在服务和质量方面。然而,在使用和费用方面仍有一些改进的空间,可以考虑优化界面设计、提升软件稳定性,并进一步优化费用设置以提升用户满意度。
为了更直观地比较用户对不同移动健康App各维度满意度得分,本文对搜集的好大夫在线、微医和春雨医评论数据进行相同操作,并将各个维度的情感得分进行可视化展示,结果如图5所示。
由图5可知,好大夫在线、微医和春雨医生在服务、便利、质量、使用和费用五个方面的情感分值呈现相同的趋势,即用户对App的服务和质量维度最满意,便利维度次之,且其满意度得分均在0.6以上。而使用和费用维度满意度较差,得分均在0.6以下,说明这两个维度是服务供应商需要继续努力提升改进的。
相比好大夫在线和春雨医生,微医在服务维度获得了最高的情感得分,显示用户普遍更认可微医上医生的服务态度和响应速度;同时微医在提供医疗服务的便利性方面做得也最好,包括网上挂号、咨询、电话沟通等,这为用户带来了更加高效便捷的就医体验。然而,微医在使用维度获得了最低的情感分值,这表明微医在界面设计或软件稳定性等方面给大多数用户带来了负面体验,导致用户对此维度的整体体验和满意度很低。相比之下,好大夫在线在质量、使用和费用方面是三款App中表现最出色的,这表明多数用户对好大夫在线提供的医疗健康信息的质量持认可态度,且对其使用和费用方面的体验较为满意,这些维度可以作为该品牌营销的优势和亮点,从而使产品更加具有竞争力。
Figure 5. Sentiment score for different mobile health App by dimensions
图5. 不同移动健康App维度情感分值图
根据以上分析可知,三款移动健康App在服务、便利和质量维度满意度较高,表明获得了用户普遍认可;而使用和费用维度都显示出低满意度,说明企业应注重软件系统性能和性价比等方面满意度的提升。不同App在软件特征方面各有优劣,服务提供商应针对自身的优劣对软件进行改进,在了解竞争对手产品特征的情况下,保持自己的优势特征,改进劣势特征,对软件的长久发展具有重要作用。
4. 结论
首先,本文以移动健康App用户真实评论为数据源,利用词云图、word2vec和高频名词识别评论中包含的维度,并通过建立的维度特征词表和SnowNLP情感分析方法得到每个维度的权重和情感得分。研究结果表明,影响移动健康App用户满意度的关键维度有服务、便利、质量、使用和费用。从最近5年的数据来看,“便利”“服务”和“质量”三个维度对用户满意度的影响最大。用户满意度得分最高的是“质量”维度,最低的是“使用”维度,当用户评论“使用”维度时,他们多数是负面的。根据这一研究结果,移动健康App运营商可以从“便利”“服务”和“质量”三个维度提升用户整体满意度。移动健康App软件开发者可以通过从“使用”维度中提取的特征词,改善软件的交互性,增强系统的稳定性,提高软件的质量。
本文也有一定的局限性:本文只选取了苹果App Store的评论数据,没有考虑其他平台和其他形式的数据。在未来的研究中,样本量可以进一步扩大。例如,在未来的研究中,可以探讨不同国家和不同类别移动健康App用户关注维度的差异以及其满意度得分,分析也可以结合跨文化理论。此外,本研究使用SnowNLP情感分析方法计算评论文本情感分值,未来的研究可以尝试其他情感分析方法,如深度学习方法,以提高维度情感分析的准确性。