1. 引言
2023年2月6日,国务院印发的《质量强国建设纲要》明确指出:我们要推动基于用户体验的产品质量变革和质量安全水平。根据《ISO9241-210人机交互、人机工程学国际标准》的定义,用户体验是使用产品、系统或服务过程用户的感知和反应,它包括用户在使用前、使用中和使用后的所有情感、信念、偏好、感知、生理和心理反应、行为和成就。
伴随着数字经济时代的到来,以算法技术为基础的大批网络平台对数字经济发展起到至关重要的作用,日益成为做强、做优、做大我国数字经济的关键力量 [1] 。网络平台注重用户的主观体验。如果用户在第一次使用网络平台的时候就发现较为复杂,不能及时找到自己想要的内容,那么下次基本上不会再继续浏览。因此,对网络平台的有用性与适用性的评估是用户体验的重要内容,可有效而及时地促进网络平台的完善。目前用户体验的测评中,问卷法是最普通使用的方法,而测评问卷多为国外编制,缺乏中国本土的适用性数据。
基于国内代表性的网络平台,探究中文版国外用户体验量表的适用性就显示出学术与现实的双重意义。
2. 国内外研究现状综述
2.1. 用户体验及测评研究
美国认知心理学家唐纳德·诺曼认为用户体验是评价一个产品质量的关键因素之一,是指用户与产品互动过程中所产生的感受。具体来说,用户体验不仅包括产品的功能性,还包括产品的易用性、外观设计等方面,是一个整体的评价标准。因此,企业需要关注用户体验,通过不断改进产品设计和用户互动,提高产品的质量和竞争力 [2] 。随着时代的发展与研究的深入,与用户密切相关的领域都涉及到用户体验,出现了越来越多的用户体验和架构 [3] 。在这个过程中客体(产品、系统、服务)、主体(用户的情绪、生理特征等)以及使用环境都是影响用户体验的关键因素。
根据用户体验的内容和构成,用户体验具有比较大的主观性,因此对于用户体验的测量,常采用主观情感测量 [4] 。常见的测量方法是问卷法,这些问卷与量表旨在评估用户在使用产品时的体验,特别是产品功能方面的体验 [5] 。如Young Seok Lee通过问卷调查和访谈法研究老年人的手机用户体验,结果发现老年人通常认为自己的手机很难使用,能够操作使用的手机功能也是有限的 [6] 。目前全世界使用最多的经典用户体验测评量表是系统可用性量表(System Usability Scale, SUS) [7] ,该量表具有中国本土的信效度检验数据(详见方法部分描述)。除此外,大多数测评量表均是国外编制,缺乏中国本土适用性的信效度检验数据。测试工具若不考虑应用领域、情境和语义等因素,将导致评估结果泛化、不清晰和不全面 [8] 。
2.2. 网络平台及其用户体验相关研究
网络平台是一个含义宽泛的概念,其在计算机科学、经济学、社会学与法学中的含义是不尽相同的。尹一君 [9] 从法学的角度,将网络平台定义为一种将网络上交易的多方相对人聚合一起并且居中为其分享信息的、提供便利服务的私主体。徐岸峰 [10] 从经济学角度,将网络平台定义为互联网、物联网、大数据与人工智能等信息技术和平台经济等创新商业模式的有机结合体,包含电子商务平台、社交媒体平台和共享平台等利用信息技术的平台型商业组织。在百度百科中,“网络平台”一词的定义为:以互联网为基础,提供互联网服务的一系列系统,以及它们所从事的商业活动。综合以上研究,本研究中“网络平台”是指以网络为载体,利用网络技术,通过网站和APP等方式,提供以信息反馈为中心的一种服务系统。通过提供新闻、娱乐、购物和交流等服务,平衡两个或多个方面的需求,成为信息传播与交流的载体。
当前,国内网络平台用户体验的研究已有进展,但在新的数字化网络环境下,如何提升用户的使用体验仍然是一个迫切需要解决的问题 [11] 。用户是网络平台的行为主体,研究网络用户体验与行为有助于社交应用的开发、升级以及维护,进而满足不同需求的用户,实现个性化、精准服务。已有研究显示,网络平台的用户行为特征表现为知识性强、隐匿性好、自主性强、内容丰富、随即性和规律性等 [12] 。刘璇 [13] 基于认心理学、人本主义以及行为主义与大众传播等理论基础对用户体验进行研究,指出用户隐匿性、信息真实性、活跃度以及反馈的时效性显著影响我国用户心理体验,还指出用户心理体验与社区活跃相互影响、相互作用,我国社交网络行业应尽快优化用户心理体验,应对激烈的市场竞争。樊雨清 [14] 认为社交网络平台满足了用户心理需求,助长用户负面的心理,用户心理指导用户行为,用户的负面心理将导致用户的不良使用行为,从而影响网络平台的发展。这些研究基于用户的角度出发,探索用户体验的特点与影响因素,但未见对国内网络平台的用户体验有用性与适用性进行测量。在针对网络平台、产品、设备进行可用性测试工具中,有用性、满意度、易用性问卷(usefulness, satisfaction, and ease of use, USE)是运用标准心理测量方法进行建构 [15] 。本研究将据此进行测量工具的适用性检验(详见方法部分描述)。
2.3. 小红书APP的相关研究
“小红书APP”是国内一个主要面向爱购物、爱生活的年轻网络用户的社会化信息交流与电商平台。用户可以在平台上搜索世界各地的好物,浏览各类达人总结的产品购买攻略与各种考试、旅游等活动的经验贴,还可以在电商平台进行线上购物 [16] 。小红书于2013年正式上线,短短一年时间,用户数就突破1500万 [17] 。官方最新数据显示,小红书APP在2023年4月,已经有了53亿的下载量,3亿多的用户,其中一、二线城市人口占50%,总人数为4300万,而男性比例上升至30%,进一步优化了用户结构。随着用户体量壮大和平台多元化发展,小红书APP早已渗透到用户衣食住行等生活的各个方面。任何用户都可以通过文字、图片、视频等形式分享自己吃穿玩乐买的经验 [1] 。
目前,小红书作为一个新兴的网络应用,其运营模式、市场营销策略以及用户创造的内容正受到越来越多的重视和研究。已有研究多为定性分析,仅有零星的定量分析。周宇阳 [18] 以马斯洛的“需要层级”与“位置”理论为基础,深层次地探讨小红书APP的成功及其所能满足的差异性要求。王旭、徐艟 [19] 以小红书跨境平台成长历程为基础,分析该平台在不同重要节点上的模式创新,探讨跨境电商平台商业模式的非连续性发展规律。曹增栋 [20] 等对小红书的用户粘性进行了研究发现:使用习惯、社会经验等因素对持续使用意向有显著的正面作用,并进一步促进用户粘性的形成。朱浩然、周昭雄 [21] 运用系统聚类法对小红书APP进行定量分析,让我们能够评估该跨境电商平台的用户体验质量,从而更深入了解其在用户体验方面的优势和不足。这些研究更多地从经济学的角度分析小红书APP用户体验,尚缺乏心理学角度的人因学证据。
综上所述,本研究拟基于小红书网络平台收集数据,探索USE问卷中文版本的中国本土有效性及文化适用性。
3. 研究方法
3.1. 研究对象
本研究采用方便取样在国内各高校线上、线下共招募大学生被试1076名,删除165份规律答题问卷,一共有911份有效问卷,有效回收率为84.67%,其中男性被试446名,女性被试465名,年龄范围在18~23岁之间。将所收集的数据分为两个部分,第一部分455份问卷,男性223名,女性232名,利用SPSS26.0对USE问卷进行项目分析与探索性因素分析(EFA);第二部分456份问卷,男性223名,女性233名,用SPSS26.0与Amos24.0对第一部分的模型进行验证性因素分析(CFA)以及相关信效度的检验,检验模型的合理性。此外,本研究还利用第二部分样本进行了用户体验的现状分析,并随机挑选60名被试,让他们在初次填写完问卷两周后再次填写,对前后两次数据进行重测信度分析。
3.2. 研究工具
3.2.1. 有用性、满意度、易用性问卷(Usefulness, Satisfaction, and Ease of Use, USE)
Arnie Lund 2001年设计了USE,共30个题项,用于获取有用性(8个题目)、易用性(11个题目)、易学性(4个题目)和满意度(7个题目)四个维度的信息。所有题目均采用正向描述,使用7级Likert等级评分,从1 (非常不同意)到7 (非常同意) [15] 。编制者基于大型题库、因素分析、计算系数、迭代开发等心理测量学方法建构此问卷,可用于产品、系统或网络平台整体的用户体验评估。
3.2.2. 系统可用性量表(System Usability Scale, SUS)
SUS主要用于测试用户对产品可用性的主观评价。John Brooke于1986年开发此量表,并在十年后出版 [7] 。原始版本未进行任何信效度测量,只显示了项目之间的强相关性(0.7 < r < 0.9)。首次对该量表进行心理测量的研究表明,SUS的α系数为0.850 [22] 。问卷调查可以根据具体的研究内容进行修改,适用范围广泛,受到各界学者的重视。2020年Wang等人对此问卷进行了中文版本的修订,所有项目都明确无歧义,被证明具有可靠性与有效性 [23] 。采用Likert5分量表,共10个条目,“非常不同意”1分,“非常同意”5分,α系数为0.840。得分越高,受试者认为产品的可用性越高。量表的偶数题目为反向描述题,每道题目的转化分值范围在0~4。正向题目的转化分值是量表原始分减去1,反向题目的转化分值是5减去原始分;所有题目的转化分值相加后乘以2.5得到SUS量表的总分,分值范围在0~100 [23] 。在本研究中,中文版SUS的α系数是0.818,将作为效标问卷,检测USE问卷的效标效度。
3.3. 翻译与回译
本研究对USE问卷进行翻译与回译,具体过程如下:首先,由两名语言学教授和一名有英语教育背景心理学专业教授将问卷从英文翻译成中文;随后,由一名心理学系教授成将三份翻译稿与原问卷进行比较与整合,形成初步的中文版;接着,由两名英语专业的教授将这份中文稿回译为英文;再邀请一名心理学专家将原版问卷和回译问卷进行对比和分析,并进行调整和修改;最后选取10位小红书APP用户填写问卷,再次修订题目,以形成中文版USE问卷。
4. 数据分析及结果
4.1. 项目分析
首先,对第一部分样本(n = 455)做相关分析,结果表明各题目与总分的相关0.01水平上达到显著,相关系数处于0.660~0.855之间。然后,根据总分对样本进行高低排序,将总得分位于前、后27%的分别划入高分组与低分组,并对两组样本在30个题目的得分进行独立样本t检验 [24] 。结果表明两组样本在30个题目的得分均差异显著(p < 0.001)。由此看出,中文版USE量表在各个题目上均表现出良好的区分能力。
4.2. 探索性因素分析
本研究的KMO = 0.978,Bartlett’s的球形检验结果亦达显著性水平(c2 = 13597.778, df = 435, p < 0.001),这表明本研究采用的测试样本,适合进行探索性因素分析(Exploratory Factor Analysis, EFA) [25] 。据此,本研究采用主成分分析法进行因素抽取,并在旋转时采用了最大方差法。为了确定因素的数量,我们以特征值大于1作为依据。研究结果显示,题目USE16在各因子上的负荷均小于0.4,无法分配到各个维度里。由此,本研究删除题目USE16,并对保留的29个题目进行第二次探索性因素分析,依然使用主成分分析方法提取因素,使用最大方差方法进行旋转。29个题目的公因素方差值范围为0.565~0.797,最终抽取出三个因素(见图1),累积解释总变异的72.415%。对于每个因素下的题目进行重新命名,依次为:a) 有用性:使用网站对于用而言是有所收获的,也是产品基础的设计原则;b) 容易性:网站容易上手,能够迅速学会如何使用并记得如何操作;c.满意度:使用网站能够满足用户的情感体验(表1)。
4.3. 验证性因素分析
依据探索性因素分析结果,本研究对第二部分样本数据(n = 456)进行验证性因素分析(Confirmatory Factor Analysis, CFA),检验三个因素的拟合程度。
![](//html.hanspub.org/file/9-3040354x8_hanspub.png?20231207082645951)
Figure 1. EFA scree plot of USE questionnaire
图1. USE问卷探索性因素分析碎石图
![](Images/Table_Tmp.jpg)
Table 1. Results of EFA of USE questionnaire
表1. USE问卷探索性因素分析结果
![](Images/Table_Tmp.jpg)
Table 2. The main fitness index of USE questionnaire
表2. USE问卷主要拟合指数
由表2可知,c2/df为3.823,虽然大于3,但是依然小于5,考虑样本量较大,基本满足拟合指数要求;RMSEA为0.079,小于0.08,较为理想;GFI为0.807,大于0.8,满足要求;NFI为0.901,大于0.8,较为理想;CFI为0.925,大于0.8,较为理想;IFI为0.925,大于0.8,较为理想;TFI为0.918,大于0.8,较为理想,模型拟合良好。
4.4. 信度分析
根据所构建的三维模型,本研究对第二部分的样本数据进行信度检验。结果显示,各因素与总问卷的内部一致性系数(α)均高于0.900,三个维度的组合信度分别为0.938、0.969和0.954,总问卷组合信度为0.984 (见表3)。总问卷的重测信度为0.733。
![](Images/Table_Tmp.jpg)
Table 3. The reliability analysis of USE questionnaire
表3. USE问卷信度分析
4.5. 效度分析
4.5.1. 聚合效度
每个潜变量对应的题目因素负荷数都大于0.7,这表明它们在所属潜变量方面具有极高的代表性,增加了我们的研究可信度。此外,每个潜变量的平均方差变异(AVE)值都大于0.5,而且组合信度(CR)值也均大于0.8,表明聚合效度非常理想 [26] 。
4.5.2. 结构效度
由于USE问卷在本研究中被划分为三个维度,即需要比较总问卷与各因素的相关系数与不同因素间的相关系数。结果显示,三个维度与总问卷之间存在显著的正相关(0.913~0.929),说明它们共同衡量了一个特定的特质。同时,三个维度之间的相关性减低(0.803~0.861),表明每个维度又具有独立的测量作用 [24] 。因此,我们的研究结论是,中文版USE问卷的结构效度良好。
4.5.3. 效标效度
本研究选用SUS量表作为效标,测得USE问卷各因素维度和总问卷的得分与该效标的得分呈现显著的正相关(r有用性 = 0.870, r容易性 = 0.852, r满意度 = 0.832, r总 = 0.891),说明该量表效标效度良好。
4.6. 实证调查结果
使用修订后的USE问卷调查结果显示,有用性、容易性、满意度三维度均值均大于5 (1为非常不满意,7为非常满意),用户对小红书APP的使用体验整体较好。
不同性别在USE问卷总分与各维度上的差异均显著,小红书APP男性用户的用户体验均显著高于女性(F总分(1, 910) = 17.282, p < 0.001,
= 0.019; F有用性(1, 910) = 6.712, p = 0.01,
= 0.008; F容易性(1, 910) = 23.351, p < 0.001,
= 0.026; F满意度(1, 910) = 26.173, p < 0.001,
= 0.029)。
不同使用频率在USE问卷有用性与满意度上的差异均显著,使用频率高的用户得分高于使用频率低的用户(F有用性(3, 910) = 6.712, p = 0.01,
= 0.083; F满意度(3, 910) = 17.987, p < 0.001,
= 0.058)。
使用时间与使用频率在USE问卷总分(F(9, 910) = 2.118, p = 0.026,
= 0.021)与容易性维度(F(9, 910) = 2.509, p = 0.008,
= 0.025)上交互作用显著,表现出一致性趋势:当使用时间一周以上,使用频率高的用户的得分高,使用频率低的用户则得分低;当使用频率为一天一次时,使用时间长的用户体验得分显著高于使用时间短的。
5. 讨论
5.1. 关于中文版USE问卷的修订与检验
中文版USE问卷的项目分析显示各题目与总问卷的相关在0.679~0.752之间,前后27%高低分组的独立样本t检验发现,两组样本在30个题目的得分均差异显著(p < 0.001),表现出较好的区分度。采用主成分分析法对量表进行探索性因素分析,题目16因素负荷小于0.40,该题目表述为“在使用过程中,我没有发现任何不一致”,语意中含双重否定,语言逻辑较为复杂,不符合大多数中国人的表述习惯,因此将该题目移除。接着对保留的29个题目进行第二次探索性因子分析,结果显示,得到三个因素维度,累积解释总变异的72.415%,且各因素所对应的题目所代表的意义都比较一致,没有命名上的障碍。因此,重新命名得到有用性、容易性和满意度三个因素。
本研究继而对第二部分样本数据进行验证性因素分析,采用结构方程模型方法,来确定实际数据对中文版USE量表三因素结构模型的拟合指标,各项拟合指数都达到了理想的标准。随后的信度、效度检验,亦符合测量学标准。
5.2. 基于小红书APP用户体验的实证分析
大学生对小红书APP用户体验感较好,各维度均分都大于平均值。表明小红书APP的用户对小红书的整体体验和满意度较高。这与前人研究相一致 [13] 。
深度访谈可知,大家一致认为:(1) 个性化推荐:小红书APP拥有准确的用户画像和智能推荐算法,能够根据用户的兴趣爱好和行为习惯,为用户推荐感兴趣的内容和商品,提高了使用的个性化体验。(2) 社交互动:小红书APP是一个社交平台,用户可以与其他用户互动、分享自己的心得和经验,增强了用户的归属感和参与感,提高了用户粘性。(3) 用户界面设计:小红书APP界面设计简洁清晰,易于使用,使用户可以更便捷地浏览和操作内容,提高了使用的便利性和舒适度。因此,小红书APP通过个性化推荐、社交互动、用户界面设计和商品质量保证等方面,提高了用户的体验评价,成为一个备受欢迎的社交和分享好物应用。
在性别上,小红书APP的男性用户比女性用户表现出更好的用户体验。小红书的内容注重实用性,男性使用者更倾向于查看关于电子产品、户外运动、健身和美食等领域的推荐和资讯;小红书APP在用户界面和使用体验等方面注重简约和实用性,也符合大多男性用户的审美和喜好。目前,使用小红书APP的男女比例为3:7左右 [27] ,女性用户在使用小红书APP时需要更多专业、精致和感性化的内容和体验,还关注小红书APP的社交和互动功能,所以用户体验要求比男性更高。这个结果也显示出小红书APP在产品设计和运营上需要进行深入的挖掘和满足,才能增加女性用户满意度和忠诚度。
使用时间长、使用频率高的用户对小红书APP的用户体验评价较高。事后访谈发现:(1) 熟悉程度:使用时间长、频率高的用户对小红书APP的界面、功能等更加熟悉,容易找到自己所需的信息和功能,从而对用户体验评价更高。(2) 积累经验:使用时间长、频率高的用户在使用过程中,积累了更多的使用经验,优化了个人使用习惯和流程,从而提高了用户体验评价。(3) 满足需求:使用时间长、频率高的用户通过小红书APP获得了更多的信息、帮助和互动,满足了个人需求,形成了与小红书APP的习惯和情感联结,从而对用户体验评价更高。反之,若用户没有良好的使用体验,可能会减少对小红书APP的使用意愿,进而降低对APP的评价。(4) 个性定制:对于使用频率高的用户来说,使用时间与频率越多,推荐的内容越丰富,更符合该用户的兴趣爱好;而对于使用频率低的用户来说,推荐的内容也较少,导致用户体验评价走低。
6. 结论
本研究将原有USE问卷的第16题删除,共留下29个题目,重新聚类与命名,形成了新的有用性、容易性、满意度三个维度的中文版USE问卷。该问卷的信度、效度较高,结构合理,符合测量学标准,在中国具有一定的文化适用性,可用于用户体验可用性的测评。依托小红书APP测试得到的数据,反映出使用者在性别、使用时间与使用频率上的用户体验特点,同时也为该测试工具提供了实证效度依据。
基金项目
国家自然科学基金重点项目(Grant No. 61936010);
重庆文理学院横向项目(No. WLHX-2020-0033)。
NOTES
*通讯作者。