考试焦虑双字词库的补充评定

doi:10.12677/AP.2017.79140

期刊菜单

考试焦虑双字词库的补充评定
Supplementary Evaluation of Two-Word Thesaurus in Test Anxiety

DOI: 10.12677/AP.2017.79140, PDF, HTML, XML,
作者: 孔仪然, 罗宇彤, 李建勋：西南大学心理学部，重庆
关键词: 考试焦虑；词库；评定；Test Anxiety； Lexical Database； Assessment

摘要: 考试焦虑是影响学生学习质量的重要原因之一，由于之前的词库维度较少，意在之前双字词评定的基础上增加愉悦度、唤醒度和形象性三个维度，补充评定考试焦虑双字词库。研究通过测验焦虑量表(Test Anxiety Inventory, TAI)、状态–特质焦虑问卷(State-Trait Anxiety Inventory, STAI)两个问卷区分高中低考试焦虑组，选取西北民族大学在校本科生45人，对406个经过筛选的双字词进行愉悦度、唤醒度、形象性三维度上的评定。结果显示，词汇库内部一致性信度均在0.8以上；被试在唤醒度、形象性上不存在性别差异，但愉悦度上存在性别差异；通过聚类分析发现，愉悦度低唤醒度低的词汇较少。本研究所评定的词汇满足标准化词库的要求，评分结果稳定、可靠，可作为相关考试焦虑研究的实验材料，但有待进一步改善。

Abstract: Test anxiety is one of the important factors affecting the quality of student learning. The aim of the study was to supplement the dimensions of assessment test anxiety double word libraries, because of fewer dimensions of the already existing lexical database. The degrees of pleasure, arousal and image were assessed. Test Anxiety Inventory (TAI) and State-Trait Anxiety Inventory (STAI) were used to distinguish three groups, including high, moderate and low test anxiety. 45 undergraduates from Northwest University for Nationalities were participated this research to assess 406 words at the degrees of valence, arousal, image. The results showed that the coefficients of the internal consistency were all above 0.8; for gender there were significant differences in the degrees of arousal and pleasant, but not for the degree of image; for different anxious groups, there were no significant differences in three dimensions. The reliability and validity of the test anxiety words system are acceptable and this system can provide normalized stimulant materials for further research in text anxiety.

文章引用：孔仪然, 罗宇彤, 李建勋 (2017). 考试焦虑双字词库的补充评定. 心理学进展, 7(9), 1122-1129. https://doi.org/10.12677/AP.2017.79140

1. 前言

考试焦虑(Test Anxiety)是个体在考试或评价情境中产生的一种消极的情绪反应(董军强，陈建勇，2013)，被界定为一种情境化的特质焦虑(Keogh, & French, 2001；于靓，陈睿，张小聪，等，2011)，包括对考试或考试情境过度的生理和心理反应，在考试情境中，此特质个体的焦虑会上升。研究表明，严重的考试焦虑不仅影响学生的学业成绩和学习活动，还影响到学生的心理健康水平(Lowe, Lee, Witteborg, et al., 2008)，导致焦虑、抑郁、无助感及自杀的增加。为了降低考试焦虑的不良影响，有必要进一步研究。而在以往的考试焦虑研究中，采用的实验刺激材料包括图片和文字(Lawson, 2006；陈睿，刘潇楠，周仁来，2011)，然而，由于缺乏一套标准化的刺激系统，使得研究材料的选择和研究结果的可比性出现困难。

考试的典型形式是笔试，文字形式的考试内容本身往往引发考试焦虑。因此，采用文字材料作为刺激可以更好地研究考试焦虑。然而已有的考试焦虑文字材料即考试焦虑词汇库维度过少，根据Osgood等的理论，主要考虑以下三个维度理论，考试焦虑作为一种情绪反应其中唤醒度、愉悦度可作为测评的维度，而作为一种认知评价，词汇的形象性也具有评定的必要(于靓，陈睿，张小聪，2011)。因此，有必要对建立的标准化考试焦虑词库进行补充评定，既能使研究者更便捷地选择刺激材料，又增强了不同研究结果间的可比性(Bradley & Lang, 2017)。因此，本研究以期通过评定，对建立的标准化考试焦虑词库进行补充评定。

2. 研究方法

2.1. 研究对象

来自西北民族大学的二、三年级的学生，通过方便取样发放包含TAI、STAI-S、STAI-T三份问卷1041份，以M ± 1SD筛选标准，区分高、中、低三个焦虑组共50人参加实验。其中5位同学因评定数据不全被剔除，最后有45名大学生的评定数据进入了分析(平均年龄为20.85 ± 0.82岁)。其中，女生19名(20.86 ± 0.75岁)，男生26名(20.85 ± 0.86岁)。被试视力或矫正视力正常，无任何精神疾病。实验前要求被试签署知情同意书，并告知其实验内容及性质，实验后给予少量报酬。

被试需要完成美国临床心理学家斯皮尔伯格编制、修订的测验焦虑量表(Test Anxiety Inventory, TAI)和状态–特质焦虑问卷(State-Trait Anxiety Inventory, STAI)中的特质量表(STAI-T)、状态量表(STAI-S)，其中TAI中国修订本，包括忧虑性(TAI/W)和情绪性(TAI/E)两个分量表(Lang, Cuthbert, & Bradley, 1997)。共20题，按1~4级评分，“从不”为1分，“总是”为4分，总分最低为20分，最高为80分。国际上流行的考试焦虑测评量表多达数十种，但最有效的且应用最广泛的莫过于TAI (Spielberger, 1980)。此外，状态–特质焦虑问卷采用Likert4点量表形式，每一项目以1~4计分，得分越高代表焦虑程度越高。本文选取其中的STAI-T用作效标。中文版STAI具有良好的信度和效度(王才康，2003)。

2.2. 实验材料的收集制作

在原有词库所筛选出来的词汇的基础上，对406个双字词进一步进行添加维度地评定，将双字词统一处理为图片，并用E-Prime软件编制程序并呈现在计算机屏幕上，显示屏分辨率为72像素/英寸，像素为1024 × 768，双字词图片大小为20 mm × 40 mm，黑底白字、宋体加粗。

2.3. 维度的评定

在借鉴考试焦虑相关研究的基础上(Lawson, 2006；陈睿，刘潇楠，周仁来，2011；于靓，陈睿，张小聪，2011)，对词汇进行评定时，从情绪研究的维度观点出发，根据奥斯古德等的理论，主要考虑以下三个维度：唤醒度，即阅读该词后感觉其是否能引起自己的警觉关注，如感到眼前一亮、令人敏感、刺激或迟顿、昏昏欲睡等；愉悦度，即阅读词汇后感受到的愉快与否、相关程度；形象性，即阅读该词时感觉具体或抽象的程度(李文利，钱铭怡，1995；王一牛，ZHOU Li-Ming，罗跃嘉，2008；Kemp, Gray, & Eide, 2002; Aftanas, Varlamov, & Pavlov, 2002)。采用自我报告模式(Tucker, Hartry-Speiser, & Mcdougal, 1999)，让被试分别在三个维度上对词汇进行7点量表评分，评分从1到7，1表示低值(低唤醒度、低形象性、低愉悦度)，而7则代表高值(高唤醒度、高形象性、高愉悦度)。

2.4. 实验程序

实验前向被试解释实验内容，并签署被试知情同意书。然后让被试坐于距计算机屏幕70 cm的椅子上，熟悉实验流程后，主试输入被试的基本信息后进入正式实验。首先在屏幕中央出现500的注视点，然后出现词汇，要求被试根据自己的所体会到的感受，按计算机数字键1~7对词汇进行评分，评价时间由被试自己控制，但不能做长时间思考，按键评分后会呈现500ms的空屏，接着进入下一词汇评定(参见图1)。评定完所有词汇的一个维度后休息一次，再进入另一维度的评定。词汇在每个维度内随机出现，且三个维度的顺序被试间在随机。

2.5. 统计处理

用SPSS17.0对实验数据进行描述性统计分析、差异性分析、聚类分析及散点图分析等。

3. 结果

3.1. 被试信息

被试在TAI、STAI-S、STAI-T三个量表上的描述性统计结果见表1。经独立组T检验表明，被试在两个量表上的得分在0.05水平上性别不存在显著性差异。

根据被试的TAI得分分为三组，见表2。经方差分析表明，三组被试在TAI和STAI-T/-S上的得分存在显著差异(F_(2,44) = 52.60, p < 0.001; F_(2,441) = 37.33, p < 0.001; (F_(2,43) = 35.77, p < 0.001)。

Figure 1. Experiment process

图1. 实验流程图

Table 1. TAI, STAI-S and STAI-T scores among male and female groups: M(SD)

表1. 男女大学生的TAI和STAI-S/STAI-T量表得分的描述统计结果：M(SD)

Table 2. TAI scores in each condition by level of test anxiety: M(SD)

表2. 根据被试TAI得分的分组情况：M(SD)

3.2. 考试焦虑词汇在三维度上的属性得分情况

分别对45名被试评定的406个词汇，在愉悦度、唤醒度和形象性上的得分，进行描述性统计分析，结果见表3。进一步分析表明，男女大学生在唤醒度、形象性上的评价差异都不显著，但在愉悦度上差异显著(见表4)，不同考试焦虑组别被试在唤醒度、形象性上的评价不存在显著差异，在愉悦度上差异显著(见表5)。

3.3. 评分一致性分析

采用内部一致性信度中的克隆巴赫系数(Cronbach的α系数)，对45名被试判断的406个词汇的评分结果，进行信度的分析，以评定测验结果的一致性、可靠性及稳定性。信度系数越高即表示该测验的结果越一致、稳定可靠。结果表明，在愉悦度、唤醒度和形象性的评分上，被试评定的内部一致性信度系数分别为0.92、0.81、0.94。这表明，被试在词汇评定中的评分一致性很高，结果可信。

Table 3. 406 words scores among three dimensions: M(SD)

表3. 406个词汇在三个维度上评分的描述统计结果：M(SD)

Table 4. Means and standard deviations in three dimensions for the male and female groups

表4. 男女大学生在三个维度上评分结果比较

Table 5. Means and standard deviations in three dimensions for the level of test anxiety groups

表5. 不同考试焦虑组别被试在三个维度上的评分结果比较

3.4. 聚类分析

用快速聚类法对词汇的唤醒度进行聚类，将词汇分为两类，其中唤醒程度高的词汇：n = 221，M = 5.2800，SD = 0.35；低相关的词汇：n = 185，M = 3.88，SD = 0.406，两类词汇之间唤醒程度差异显著，t = −36.60，p < 0.0001。且两类词汇在形象性上的差异比较表明显著，t = −5.31，p < 0.0001。为了保证词汇在形象性上无差异，且都保持在较高形象性上，将词汇按照形象性评分从高到低排序，逐个删除分值较低的词汇，并检验形象性差异，最终排除152个词汇。最后确定254个词汇入选考试焦虑词汇库(见表6)。再次对入选的两类词汇进行唤醒度和形象性检验，结果表明，两类词汇在考试唤醒度上差异显著，t = −27.64，p < 0.001，在形象性上的差异不显著，t = 0.41，p > 0.05。

用愉悦度对两类词汇进行聚类分析，最后聚类出四类词汇(见表7)。对四类词汇的唤醒、形象性进行方差分析，结果表明，四类词汇在唤醒度上的差异均显著，F_(3,250) = 480.80，p < 0.0001，这表明聚类分析有一定的区分能力，有助于后续相关研究对词汇的选择；但在形象性上差异不显著，F_(3,250) = 1.69，p > 0.05。

3.5. 唤醒度与愉悦度之间的评分分布散点图

为进一步分析唤醒度与愉悦度之间的关系，对愉悦度和唤醒度评分平均分之间做了评分分布散点图。从图2中可以看出，被试对词库中的词汇在愉悦度和唤醒度两维度评分的平均分分布状况。整个评分分布几乎呈现线型分布，有个别极端相关和威胁的词汇出现。且唤醒度评分和愉悦度评分都处于较高水平时，词汇相对较多；而唤醒度的评分相对较低时，愉悦度评分处于较低水平，词汇较少。

Table 6. 254 words scores among imagery and valence dimensions: M(SD)

表6. 254个词汇在形象性和愉悦度上评分的描述性统计结果：M(SD)

Table 7. Lexical clustering results

表7. 词汇聚类结果

Figure 2. Scatter score between arousal and valence

图2. 唤醒度和愉悦度之间评分散点图

4. 讨论

该研究采用自我报告模式，在借鉴汉语情感词系统及考试焦虑图片库系统的评定基础上，编制了考试焦虑词库系统，在词汇材料的选择上，力求广泛丰富。其次，除评定了唤醒度和愉悦度外，还增加了形象性的维度。因为考试焦虑作为一种特殊情境下的情绪反应具有维度性的特点，刺激与个体的主观唤醒程度、唤醒的情感体验、唤醒事件的形象性的不同，对个体产生的影响也可能会有差异。形象性作为对语言共性，是语言认知评价的重要因素之一，具有评价意义。内部一致性信度分析结果表明，被试在对愉悦度、唤醒度和形象性的评分上，评定的内部一致性很高，这说明在同一维度下被试的评分一致性和同质性较好，不同被试对同一词汇的评定较为一致、可靠。

由评分分布散点图可以看出，考试焦虑词库中的词汇的唤醒度和愉悦度的平均值成线性地分布在七点量表上，整个评分分布范围较广，有个别极端词汇出现。由于考试焦虑词库评定主要针对学生群体关于考试焦虑的认知评定，而这一群体对考试相关词汇的唤醒度要求较高，考虑到要尽量保持高唤醒度和低唤醒度词汇在个维度上的平衡，因此在词汇的选择上多选取的是形象性相对较高的词汇，使形象性的评分集中于较高水平。同时在词库选择过程中，根据逐个排除形象性低的词汇，并依次检验形象性差异，最终保证入选词汇库的高、低考唤醒度词汇间无差异。

以唤醒度进行聚类，与考试高及低相关的词汇的分布较均匀，类别间相关度差异显著；而结合愉悦度进行聚类的结果表明，四类词汇间在唤醒度差异显著。这表明聚类分析在这些维度上有一定的区分能力，且被试对词汇的评定较为一致，但在形象性上差异不显著，表明形象性在愉悦度上不具备区分能力。

此外，在0.05水平上高中低考试焦虑组别的被试，在词汇三个维度的评定上的差异都不显著。被试对词汇的评定较为一致，即在对词汇的评定阶段，被试组间差异不显著。不同性别的被试在唤醒度和形象性上差异不显著，但在愉悦度上差异显著，原因可能是由于女性的积极情绪与消极情绪的相关程度比男性高原因导致的，比如女性更倾向于以辨证方式体验和表达情绪，评定出相对更接近于平均数的分数(伏春宇，杨炳钧，2006)。

综上所述，考试焦虑双字补充词汇库可以作为一套作为补充修订词库，补充了标准化的刺激系统，为今后考试焦虑的研究提供标准化的实验刺激材料。然而，考试焦虑词库仍需继续完善。首先，词汇库中只选择了双字词作为材料，且涉及的数量较为有限，每个维度分段上的词汇较少，尤其是低唤醒、低愉悦词汇不多，为了能给今后的相关研究提供更多的选择空间，有必要在后续研究中进一步扩充词汇库；此外，词库是在有限范围内的被试中进行评定的，对于同一个词汇，不同评定者也许有不同感受，因此，该词库只能提供一个相对稳定的标准。同时，在今后的研究中需要进一步探讨词库在其他样本群体中的适用性。

5. 结论

考试焦虑双字补充词汇库可为今后考试焦虑的研究提供标准化的实验刺激材料。

附录

评定词汇表举例

钢笔升学容貌失眠实话倾听倾诉团聚单词获奖

知网检索的两种方式：

1. 打开知网页面http://kns.cnki.net/kns/brief/result.aspx?dbPrefix=WWJD

下拉列表框选择：[ISSN]，输入期刊ISSN：2160-7273，即可查询

2. 打开知网首页http://cnki.net/

左侧“国际文献总库”进入，输入文章标题，即可查询

投稿请点击：http://www.hanspub.org/Submission.aspx

期刊邮箱：ap@hanspub.org

参考文献

[1]	陈睿, 刘潇楠, 周仁来(2011). 不同程度考试焦虑个体对威胁性刺激注意机制的差异. 心理科学, 1, 151-154.
[2]	董军强, 陈建勇(2013). 核心自我评价、应对方式对大学生考试焦虑的影响. 科技通报, 29(1), 209-214.
[3]	伏春宇, 杨炳钧(2006). 英汉语言形象性对比研究. 外国语文, 22(1), 126-131.
[4]	李文利, 钱铭怡(1995). 状态特质焦虑量表中国大学生常模修订. 北京大学学报: 自然科学版, 31(1), 108-114.
[5]	王才康(2003). 考试焦虑量表(TAI)的信度和效度研究. 中国临床心理学杂志, 11(1), 69-70.
[6]	王一牛, Zhou, L.-M., 罗跃嘉(2008). 汉语情感词系统的初步编制及评定. 中国心理卫生杂志, 22(8), 608-612.
[7]	于靓, 陈睿, 张小聪, 等(2011). 考试焦虑图片库的编制:在中国大学生群体中的试用. 中国临床心理学杂志, 19(1), 38-41.
[8]	Aftanas, L. I., Varlamov, A. A., Pavlov, S. V. et al. (2002). Time-Dependent Cortical Asymmetries Induced by Emotional Arousal: EEG Analysis of Event-Related Synchronization and Desynchronization in Individually Defined Frequency Bands. International Journal of Psychophysiology Official Journal of the International Organization of Psychophysiology, 44, 67-82.
[9]	Bradley, M. M., & Lang, P. J. (2017). International Affective Picture System. In Encyclopedia of Personality and Individual Differences (pp. 1-4).
[10]	Kemp, A. H., Gray, M. A., Eide, P. et al. (2002). Steady-State Visually Evoked Potential Topography during Processing of Emotional Valence in Healthy Subjects. Neuroimage, 17, 1684-1692.[CrossRef] [PubMed]
[11]	Keogh, E., & French, C. C. (2001). Test Anxiety, Evaluative Stress, and Susceptibility to Distraction from Threat. European Journal of Personality, 15, 123-141.[CrossRef]
[12]	Lang, P. J., Bradley, M. M., & Cuthbert, B. N. (1997). International Affective Picture System (IAPS): Instruction Manual and Affective Ratings. In FL: NIMH Center for the Study of Emotion and Attention. Gainesville: University of Florida.
[13]	Lawson, D. J. (2006). Test Anxiety: A Test of Attentional Bias. An Abstract of the Thesis Presentedin Partial fulfillment of the Requirements for the Degree of Doctor of Philoso-phy.
[14]	Lowe, P. A., Lee, S. W., Witteborg, K. M., et al. (2008). The Test Anxiety Inventory for Children and Adolescents (TAICA). Journal of Psychoeducational Assessment, 26, 215-230.[CrossRef]
[15]	Spielberger, C. D. (1980). Test Anxiety Inventory: Preliminary Professional Manual. Palo Alto, CA: Consulting Psychology Press.
[16]	Tucker, D. M., Hartry-Speiser, A., Mcdougal, L. et al. (1999). Mood and Spatial Memory: Emotion and Right Hemisphere Contribution to Spatial Cognition. Biological Psychology, 50, 103-125.

为你推荐

友情链接