1. 引言
随着防疫政策放开以及大众对优质的医疗服务的需求增多,传统医疗不一定能满足人们看病就医的需求,从而促使在线医疗成为大众接受医疗服务的理想之选。然而,我国在线医疗平台仍存在各种问题,使得其无法满足大众的就医需要。如何评价当前的在线医疗平台,以及用户应如何选择优质的在线医疗平台,是本文需要探究的重点问题。
多位学者对满意度的研究已较为深入。范珈瑜 [1] 对游客针对古镇旅游项目的评论文本进行文本分析,运用情感分析进行评分,结合因子分析建立综合模糊评分模型。吴维芳、高宝俊 [2] 等人利用word2Vec对酒店评论进行特征抽取和降维,结合情感分析技术,提取每类特征对应的情感,构建计量经济模型分析酒店特征评价与用户满意度的关系,研究影响酒店用户满意度的因素,为酒店管理者提供建议。廖雨婷 [3] 等人构建了一套量化的电动汽车用户充电满意度评价指标体系,从而掌握用户充电满意情况,并利用层次分析法确定各级指标权重。通过问卷调查方式收集数据,运用模糊综合评价模型对数据进行综合评价,找出提高用户充电满意度的关键因素。孟世玉 [4] 等为探讨北流市北部乡村景观村民满意度水平及影响因素,提取出6个一级评价指标和25个二级评价指标,运用AHP-熵权组合法确定指标的权重。其次运用TOPSIS-灰色关联评价模型对村民满意度进行测评,并利用障碍度模型对障碍因子进行诊断。Zeinalizadeh,N. [5] 等人通过调查问卷收集数据,对收集到的数据进行探索性因子分析,以确定影响客户满意度的因素。利用因子分析的因子分数建立了多层感知器神经网络模型,并用该模型预测整体银行客户满意度。
本文基于从网络上爬取的主流在线医疗平台的评价文本,利用文本特征分析,情感分析等方法挖掘影响用户对在线医疗平台服务满意度的因素后,运用层次分析法、TOPSIS法、熵权法、TOPSIS法结合熵权法搭建满意度模型,并将几个模型进行对比,为在线医疗平台有针对性地提高医疗服务和性能提供建议,以及为用户选择合适的在线医疗平台提供帮助。
2. 数据来源
本研究利用python网络爬虫技术,于2022年9月从华为应用市场、360手机助手等应用市场中爬取当前主流在线医疗平台的用户评论文本信息。
3. 模型的假设
1) 假设评论文本信息均真实可靠;
2) 假设文本信息预处理阶段去除的语气词,停顿词等对后序的文本分析的准确性无影响;
3) 假设评价模型的各个评价指标正向影响用户对移动医疗APP的服务满意度。
4. 模型构建
4.1. 评论数据预处理
我们对爬取的评论文本进行数据预处理。本文将评论文本统一格式,去除评论中非文本内容,删除无用数据及重复数据;将专有名词添加到自定义字典中,结合相应的停用词表对文本数据进行清洗;运用python中的jieba分词对清洗后的数据进行分词处理;最后统计分词后的高频词。
运用TF-IDF算法评估高频词在所爬取的评论文本集中的重要程度。我们高频词的词频进行归一化的处理;运用逆文档频率分配高频词权重,计算高频词的TF-IDF值;将文本中的词语转换为词频矩阵并计算各个词语出现的次数;统计每个词语的TF-IDF权值。将文本转为词频矩阵并计算TF-IDF后,再将TF-IDF矩阵抽取出来;最后,输出词典以及文本向量。分析所得结果可知,矩阵每一行的数值的平方相加等于1,由该结果我们初步得到赋予各个高频词语的权重数值。
4.2. 语义网络知识图谱
因为与影响用户满意度的因素的词语大多为名词,我们对高频词进行词性标注,筛选出其中的名词并将其初步分类,该分类结果作为后续高频词划分的参考。筛选出的高频词后,我们绘制相应的语义网络图。
分析语义网络图可初步猜测:医生的专业度,医生医德医风,医生所属医院的等级是影响用户对平台中医生的满意度的因素;在线医疗平台的性能优劣,软件功能的齐全度,客服服务态度等方面是影响用户对软件满意度的主要因素。
4.3. 聚类分析
结合TF-IDF算法的结果,运用层次聚类 [6] 进行进一步分析。筛选其中TF-IDF值前50的词语,计算不同词语之间的余弦相似度矩阵。对分类结果进行分析,我们认为高频词的可能主题分别为“医生”和“软件”。其中,“软件”又可细分为“软件的性能”、“软件的有用性”和“软件的服务质量”3个子类。该结果可作为后期对提取总结影响用户对在线医疗平台满意度因素的参考。
利用K-means算法,结合词向量模型,我们利用之前筛选出的50个高频词计算轮廓系数,确定最佳聚类个数。通过对结果的分析对比,我们认为将50个高频词划分为三个类别时,得到的结果最为理想。
4.4. LDA模型
分析LDA模型的结果可知,主题1高频词为:“问诊”“客服”“挂号”“医疗”等,主要体现用户对平台功能及平台使用是否便利的重视;主题2高频词为:“医生”“平台”“专业”“态度”等,主要体现用户对医生业务能力和专业度的重视;主题3高频词为:“医生”“服务”“解决”“病情”等,主要体现用户对医生态度及能力的重视;主题4高频词为:“软件”“医院”“资讯”“耐心”等,主要体现用户对软件平台咨询回复的有效性和客服关怀、服务态度的重视。
4.5. 层次分析法
基于以上分析结果,我们得到评价模型的一级评价指标为“医生”和“软件”,二级指标为,“医生”维度:医生专业性、医德医风、患者信任度;“软件”维度:软件有用性、软件可靠性、软件性能、费用、客服关怀。
确定两个一级指标、“医生”维度和“软件”维度的判断矩阵后,分别利用算术平均法、几何平均法和特征值法计算权重,可以得到二级指标相对一级指标、一级指标相对于总的准则的权重(此处取算术平均法得到的权重,保留三位小数)。
各指标权重如下(见表1):
![](Images/Table_Tmp.jpg)
Table 1. Weights of primary and secondary indexes
表1. 一级指标、二级指标权重
由上表可知,二级评价指标中,权重较大的指标为医生的专业性及软件的有用性,而软件的客服关怀及软件性能所占权重较小。由此可判断用户在选择在线医疗平台时,更看重医生的专业度和软件的有用性,对软件的客服关怀和软件性能的关注度较小。因此,在线医疗平台在进一步升级APP时,建议重点提高所引入的医生的专业性及软件的有用性。
对于该模型而言,层次分析法把研究对象作为一个系统,按照分解、比较判断、综合的思维方式进行决策,比较简洁实用。但由于判断矩阵是基于人们经验所获得,导致其具有较强的主观性,可能使得结果一定程度上不够准确和不够客观。
4.6. 情感分析
由于用户评价中所包含的态度通常不是完全积极或完全消极,因此,为得到在线医疗平台的用户满意度评分,我们不能简单计算评分结果的均值。机器计算的结果是基于词语字面表达的态度(积极或消极)得来的,仅依据少量的文字表达难以得出理想的具体评判分值。为此,我们建立评价模型,该模型可以包容情感分析带来的文字到数值转化的误差。
4.6.1. 情感分组
首先我们对评论文本进行情感分组。取出一部分的评论文本作为训练样本,人为评定其情感分值后,利用机器学习对余下评论文本进行打分。通过构建情感词典对在线评论文本数据进行情感分析 [7] ,并将情感倾向性词语分为积极、中肯和消极三类。继而,我们计算三组评价数在总评价数中的占比(见表2)。
![](Images/Table_Tmp.jpg)
Table 2. The proportion of positive, pertinent and negative comments on mainstream online medical platforms
表2. 主流在线医疗平台积极、中肯、消极评论数占比
分析结果可知,“快速问医生”和“春雨医生”的积极评论占比分别位列第一第二;而“平安健康”的积极评论比例最小。由此可说明,“快速问医生”和“春雨医生”两个医疗平台用户满意度较高,而“平安健康”的用户满意度最低,建议继续完善平台服务。
4.6.2. 各在线医疗平台各二级指标情感分组
利用人工标记类别的评论训练模型,并用模型余下评论数进行分类。经整理后,得到每个在线医疗平台二级指标的评论数量及比例。
我们给各组评论进行赋分,积极、中肯、消极评价的评分分别为5分、3分、1分。计算各个二级评价指标的情感分值(见表3):
![](Images/Table_Tmp.jpg)
Table 3. Emotional score of each evaluation index of online medical platform
表3. 在线医疗平台各评价指标的情感得分
4.6.3. 满意度的计算
根据上述分析,计算得到各个二级评价指标的满意度评分,最终得到各个在线医疗平台的用户综合满意度评分(见表4)。
![](Images/Table_Tmp.jpg)
Table 4. Online medical platform scores and comprehensive scores of each index
表4. 在线医疗平台各评价指标的得分及综合得分
由上表的综合评分可知,本文选取的在线医疗平台中,用户综合满意度评分,“快速问医生” > “丁香医生” > “京东健康” > “平安健康” > “医鹿” > “春雨医生” > “好大夫在线”,由于“快速问医生”的医生专业性、软件有用性、软件可靠性的评分较高,因此其综合评分较高;同理,“丁香医生”的医生专业性、医德医风、患者满意度、软件有用性的评分较高,故其综合评分同样较为理想;而对于“好大夫在线”而言,其综合评分明显低于其他在线医疗平台,主要原因是它的医生专业性评分较低,同时其他方面的评分不占优势,导致其综合评分较低。由此我们认为,“快速问医生”和“丁香医生”APP的综合功能更全面,提供的服务更为周到,更能满足用户的需求;而“好大夫在线”的医生专业度有待提高,同时需进一步升级平台各项功能,才能为用户提供更优质的医疗服务。
4.7. TOPSIS法
考虑到层次分析法的主观性较强,为了得到更为客观的评价模型,我们采用TOPSIS法对各个在线医疗平台进行分析。TOPSIS法 [8] 是一种在多质量特性的情况下对多个方案进行综合比较排序的方法,可以充分利用原始数据信息,且其结果能充分反应各评价方案与最优方案的接近程度。我们利用在线医疗平台各属性的情感分值矩阵,乘上利用层次分析法得到的权重,构建出初始矩阵,并对其进行标准化。
假设有n个需要评价的对象,m个评价指标的标准化矩阵:
(1)
定义最大值:
(2)
定义最小值:
(3)
定义第i (
)个评价对象与最大值的距离:
(4)
定义第i (
)个评价对象与最大值的距离:
(5)
则我们计算出第i (
)个评价对象未归一化的得分:
(6)
最终得到的结果(见表5):
![](Images/Table_Tmp.jpg)
Table 5. TOPSIS method of online medical platform to obtain a percentage system score
表5. TOPSIS法所得在线医疗平台百分制得分
由结果可知,“快速问医生”和“丁香医生”的得分较高,而“春雨医生”和“好大夫在线”两个平台的得分大大低于其他在线医疗平台。因此,我们建议用户在选择在线医疗平台时,可优先考虑“快速问医生”和“丁香医生”。
4.8. 熵权法
再者,我们采用熵权法对各个在线医疗平台进行分析。利用各个软件各属性情感分值矩阵,构建初始矩阵。由于矩阵中的数据都是正数,且指标为正向化指标,因此我们直接对矩阵进行标准化。
计算第j项指标下第i个样本所占的比重,并将其看作相对熵计算中用到的概率,公式如下:
(7)
计算每个指标的信息熵,并计算信息效用值,并归一化得到每个指标的熵权。
对于第j个评价指标而言,其信息熵的计算公式为(
):
(8)
信息效用值的定义为:
(9)
则信息效用值越大,其对应的信息越多。
将信息效用值进行归一化,得到每个指标的熵权(
):
(10)
得到各个评价指标的权重:
最后,我们得到的各个在线医疗平台的得分为(见表6):
![](Images/Table_Tmp.jpg)
Table 6. The score of online medical platform is obtained by entropy weight method
表6. 熵权法所得在线医疗平台百分制得分
分析结果可知,得分较高的在线医疗平台为“快速问医生”和“春雨医生”,而“好大夫在线”和“平安健康”的得分较为不理想。建议用户在选择在线医疗平台时,可优先考虑“快速问医生”和“春雨医生”,而“好大夫在线”和“平安健康”需要完善提高平台的综合功能,以提高自身的竞争力,给用户提供更为优质的服务。
4.9. TOPSI法结合熵权法搭建满意度模型
为得到更全面更有说服力的分析,我们将TOPSIS法和熵权法结合 [9] ,对各个在线医疗平台进行分析。由指标综合权重公式:
(11)
其中,
为主观权重,
为熵权法得到的权重。
将层次分析法得到的主观权重与熵权法得到的权重结合,得到综合权重:
利用各个软件各属性情感分值矩阵乘综合权重,构建出初始矩阵再进行如上计算,得到结果如表7:
![](Images/Table_Tmp.jpg)
Table 7. Combined weight to construct the percentage system score of the online medical platform
表7. 组合权重构建所得在线医疗平台百分制得分
通过分析结果可知,在所研究的在线医疗平台中,“快速问医生”和“丁香医生”的得分最高,而“好大夫在线”和“春雨医生”的得分较低,故我们建议用户可优先选择“快速问医生”和“丁香医生”进行看病就医。
5. 结论及建议
5.1. 结论
研究结果表明,影响对医生的满意度的因素有:医生专业性、医德医风、患者满意度;影响对软件的满意度的因素有:有用性、可靠性、性能、费用、客户关怀。在各个满意度影响因素中,医生专业性和软件有用性所占比例较高,而软件的性能和客服关怀所占比例较低。结合上述层次分析法、TOPSIS法、熵权法以及TOPSIS法结合熵权法所得的各个在线医疗平台的评分可知,在我们所研究的主流在线医疗平台中,综合得分较高的为“快速问医生”、“丁香医生”,综合得分一般的为“京东健康”、“平安健康”和“医鹿”,而“春雨医生”和“好大夫在线”的综合得分相对较低。
对于所运用的评价模型,层次分析法适用于有相互关联、相互制约的多因素评价模型,较为全面和准确,但具有较强的主观性,其数学计算也较为复杂;TOPSIS法不需要确定评价指标的权重,对数据样本没有太多限制和要求,比较灵活和方便,且该方法的数学计算较为简便;熵权法根据评价指标值的属性来确定权重,较为客观,不易受人为主观性的影响,所得到的评价结果更符合实际。
5.2. 建议
结合研究结果我们建议,各在线医疗平台在进一步提升软件时,可着重提升医生的专业性和软件的有用性等,如引入更有经验专业水平更高的医生为用户解答疑惑和提供就诊建议,以及在软件中提供更多便民服务。建议“春雨医生”和“好大夫在线”提高和完善平台的各项功能,从而提高竞争力,为用户提供更优质的服务。对于广大用户而言,在选择在线医疗平台时,建议优先考虑“快速问医生”和“丁香医生”。
基金项目
华北电力大学大学生创新创业训练项目(202209001)。