1. 引言
失语症常见于脑卒中、脑内出血、脑部梗塞等脑部损伤后 [1],大约15%至42%的脑卒中患者会患上失语症 [2] [3],汉语失语症患者的言语和空间工作记忆均明显受损 [4],造成患者的语言能力,包括听觉理解能力、口语表达能力、阅读能力、书写能力的丧失或损伤。
国内外有许多常用的失语症量表。国外的有1962年提出1978年成型的Token测验,由难度逐渐增大的试题组成,可以检查患者的听力理解能力、抽象能力和记忆能力,但无法区别患者的失语症类型,且效度较低。1972年编制的波士顿诊断性失语症检查(Boston Diagnostic Aphasia Examination, BDAE)则能够进行十分全面的检查,但是花费时间长且信度较低。于是西方推出了(Western Aphasia Battery, WAB [5] )作为BDAE的缩短版 [6]。国内常用的量表还有中国康复研究中心汉语标准失语症检查量表(Chinese Rehabilitation Research Center Standard Aphasia Examination, CRRCAE),尽管其在评价患者的训练效果方面具有较好的敏感度,但每次评价需要间隔3~4周进行 [7]。2003年有国内学者设计了汉语语法检查量表(Chinese Agrammatism Battery, CAB),其在西方国家语法量表的理论和框架下选用了依据汉语习惯和规则的语句测验失语症患者 [8]。2018年有国外学者编制了(Quick Aphasia Battery, QAB)量表,旨在于15分钟内对失语症患者的失语程度进行评估 [9]。由于WAB量表不仅能对失语症患者进行十分全面的检查,且测试时间被控制在了1小时以内 [7],是较为理想的失语症量表,其汉化版被广泛使用,但其标准化程度不高,且未经过诊断验证 [10]。因此,本研究旨在通过分析汉化版WAB量表的信度与效度,改进量表,使得量表得以更准确地反映患者的失语程度,更好地适用于中国失语症患者。
2. 对象和方法
2.1. 研究对象
研究对象为47例失语症患者和29例正常人。47例失语症患者均为在上海市阳光康复中心临床诊断明确的患者,平均年龄50岁,最大年龄79岁,最小年龄20岁。其中29例为男性,18例为女性,Broca失语症类型8例,经皮质感觉性失语症类型6例,经皮质混合性失语症类型5例,经皮质运动性失语症类型10例,命名性失语症类型10例,完全性失语症类型6例,未记录失语症类型2例。选取29例正常人,其中12例为男性,17例为女性,平均年龄47岁,最大年龄83岁,最小年龄20岁。
2.2. 研究方法
为确保实验数据的准确,由上海阳光康复中心的经过系统培训的专业医师作为检查者,使用汉化版WAB量表对47例失语症患者进行评测计分,由已学习过专业医师使用汉化版WAB量表的学生对29位正常人进行评测计分,操作流程均按WAB量表使用手册进行。整个过程在被试允许的情况下进行录音,以备数据复核。
2.3. 统计学方法
使用SPSS 24.0统计学软件对数据进行处理,进行了信度检验、因子分析、相关分析等。
3. 结果
首先分析47例患者的量表数据,研究量表的信度、效度,并根据29例正常人的答题情况找出难度过大的题目。
3.1. 信度
本研究引用克隆巴赫-阿尔法信度系数评估量表的内部一致性,并以此作为量表的信度标准。克隆巴赫系数 > 0.9时表示信度极好,0.8~0.9较好,0.7~0.8可接受,0.7以下不太可信。
量表整体和各分项目的信度系数都在0.8以上,整体信度系数高达0.959,说明本量表具有较高的信度。在四个分项目中,由于自发言语部分没有小题分数记录,因此无法对本部分进行信度分析,剩余三部分信度系数都高达0.85以上,可见量表的各分项目内部一致性也较高。检验总量表及各部分内部一致性(Cronbach α系数)见表1。
![](Images/Table_Tmp.jpg)
Table 1. Cronbach’s alpha coefficient for the test of intrinsic reliability of the scale
表1. 量表内在信度检验Cronbach α系数
3.2. 效度
本研究采用结构效度、聚合效度和区分效度来评定总体效度。
3.2.1. 结构效度
本研究采用因子分析法,对量表的结构进行效度分析。首先对量表进行Bartlett球形检验,得到KMO值为0.74,在0.7以上,说明可以做因子分析。测试发现,量表的四大组成部分初始特征值总计 > 1,即只可提取出一个有效成分,且累积方差贡献率高达70%以上(见表2)。同时,该公因子在的四大组成部分的方差都大于0.4,表明每部分40%以上的方差都可以用公共因子解释(见表3),说明量表有较好的结构设计。
3.2.2. 聚集效度和区分效度
本研究通过比较量表各大题得分和总得分之间的相关性、各小题得分和所属大题得分间的相关性,评价量表的聚合效度和区分效度。相关系数大于0.7为强相关,0.3~0.7为中度相关,小于0.3为弱相关。
每大题和总分间的相关系数都>0.7,为强相关,第四大题和总分的相关性系数高达0.94,说明四部分大题设置合理,量表的聚集程度较好。但是不同大题之间的相关性系数都大于0.4,为中度相关;第四大题和第二大题、第四大题和第一大题的相关性系数大于0.7,为强相关,说明量表的区分效度较弱,相关性显著(见表4)。
![](Images/Table_Tmp.jpg)
Table 4. Pearson’s correlation coefficient between major parts and the total score (two-tailed)
表4. 各大题与总分之间皮尔逊相关系数(双尾)
每小题的区分度取值在−1到1之间,大于0.4表示该小题区分度好,0.3~0.39较好,0.2~0.29不太好需修改,0.19表示不好应淘汰(见表5及图1)。137道小题中,大部分小题的区分度好,有5道小题需要修改(见表6),5道小题应被淘汰(见表7),后续本文在讨论部分针对这些题目提出了改进建议。
3.2.3. 难度系数
本量表的难度系数及其频率分布如图2所示,各小题难度系数基本服从正态分布,因此在难度方面,本量表设计较为合理,效度较高。
![](Images/Table_Tmp.jpg)
Table 5. Distinctiveness of the questions
表5. 各小题区分度情况
![](Images/Table_Tmp.jpg)
Table 6. Questions requiring revision
表6. 需要修改的题目
![](Images/Table_Tmp.jpg)
Table 7. Questions to be eliminated
表7. 需要淘汰的题目
3.3. 正常人数据印证
对29例正常人数据着重进行难度系数的分析,从而侧面反映汉化版WAB量表的区分度(见表8)。
本量表94%以上的题目对正常人来说都十分简单(难度系数大于0.9),但仍有8道难度系数低于0.9的题目(见表9),对于正常人来说亦难度稍大,不适合用于测试失语症患者的康复程度,所以本文在讨论部分针对这些题目提出了改进建议。
4. 讨论
本研究结果发现,汉化版WAB除自发言语部分外的三部分信度系数高达0.85,内部一致性较高,信度较高;有较好的结构设计,聚集程度较好,但区分效度较弱,有8道过难的题目有待修改。且由于汉化版WAB量表的自发言语部分未设有小题,且自发命名大题中评分规则模糊,其包含7个小题,需要评测者根据患者回答这7个独立小题的信息量评0~10分,再根据流畅度、语法能力和错语评0~10分,但是信息量、流畅度、语法能力和错语达到多少程度算好并未给出标准给,导致了评测者间的给分差异,建议在这两个部分均增设可量化的分数等级供评分者参考。此外,量表的部分题目的区分度过低,难度过大,需要改变题目的内容和形式以提高效度。
![](//html.hanspub.org/file/2-2911351x7_hanspub.png?20220516093236138)
Figure 1. Frequency distribution of differentiation
图1. 区分度频率分布图
![](//html.hanspub.org/file/2-2911351x8_hanspub.png?20220516093236138)
Figure 2. Difficulty coefficients for each question and their frequencies
图2. 各小题难度系数及其频率
![](Images/Table_Tmp.jpg)
Table 8. Difficulty coefficients (normal)
表8. 难度系数(正常人)
![](Images/Table_Tmp.jpg)
Table 9. Questions with a difficulty factor below 0.9
表9. 难度系数低于0.9的题目
本文选择具有代表性的待修改题目提出改进建议。如2A(2):你叫李飞翔吗?其中“李飞翔”不是患者真名,所以正确答案为“否”。这道题目中所有患者都答对了,区分度为0。因为此题与前一小题2A(1)和小题几乎一样,量表应该避免形式和答案都相似性极高的题目短时内重复出现,从而使得患者真正经过思考理解再输出语言的过程,反映出患者语言的真实能力。如2A(19):马比狗大吗?按照常识,马一般来说都比狗要大,所以正确答案为“是”。本题区分度为0.074,低。首先,从句法角度分析,“马比狗大吗?”并不符合汉语的语言习惯,具有翻译的生涩感,直接承接了英文的语序和逻辑连接词。如2A(20):你用斧子割草吗?按照常识,斧子不常用来割草,所以正确答案为“否”。本题区分度为0.125,低。由于WAB量表的编制年份以及汉化年份都在20世纪,且东西方文化差异有所不同,所以和国内的日常生活有所脱节,应该将“斧子”、“割草”等名词替换为更现代更日常且贴合中国文化的物品和劳动。
本研究存在一定的不足之处,首先在于患者样本以及正常人样本量有限较小;其次,未进行失语症治疗前后的效果评定。未来研究可以通过扩大样本量,同时收集治疗前后数据,从而形成更大的数据集进行分析比对,进一步分析量表的信度和效度问题,为汉化版WAB量表在中国失语症患者的诊断和治疗评估中提供有效的临床依据。
尽管汉化版WAB量表存在区分效度不够高,尤其体现在命名部分与自发言语、命名部分与听力理解上。对此,本文提出了一系列改进量表效度的措施,包括但不限于:更新老旧词汇,用语日常化,减少翻译生涩感,提高问题的逻辑,以及避免相似题目短时内高频出现等。
5. 结语
综上所述,汉化版WAB量表具有较高的信度,量表的聚集程度较好,在同一特质的两种或多种测定方法间有较高的相关性 [11],难度基本符合正态分布,因此,汉化版WAB量表基本可以用于评估中国患者的失语症。