摘要: 本研究以英语专四读写综合测试为例,采用击键追踪技术对考生在完成任务过程中的写作停顿行为进行收集,同时采用刺激回忆访谈法,旨在明晰读写综合测试所引发的考生认知加工过程。结果表明:写作前期,考生主要经历推断、命题信息整合、意义构建、篇章构建等过程;写作中期,考生主要经历规划、选择、转译、组织和协同等过程;写作后期,考生主要经历监控等过程。
Abstract: This study, taking the English majors (TEM4) reading-writing integrated test as an example, collects the writing pausing behaviors of one candidate during the task completion process using a keystroke logging system and conducts a stimulus recall interview to clarify the cognitive processing. The results show that during the writing preliminary stage, the candidate mainly goes through the processes of inference, topic information integration, meaning construction, and paragraph construction; during the writing middle stage, the candidate mainly goes through the processes of planning, selection, translation, organization, and coordination; during the writing final stage, the candidate mainly goes through the process of monitoring.
1. 引言
在当今数字化和信息化的时代,教育和评估领域不断寻求更加科学、准确和有效的方法来衡量学习者的能力和表现。读写能力作为核心素养之一,其测试与评估具有至关重要的意义。传统的读写测试方法在一定程度上存在局限性,无法全面深入地洞察学习者在读写过程中的认知过程和思维模式。随着技术的不断发展,击键追踪技术(Keystroke Logging)逐渐走入研究者的视野。击键追踪技术能够实时记录学习者在完成读写任务过程中的每一次按键操作,从而为深入分析他们的认知过程提供了丰富的数据来源。本研究以英语专四读写综合测试为例,采用击键追踪技术对考生在完成任务过程中的写作停顿行为进行收集,同时采用刺激回忆访谈法,旨在明晰读写综合测试所引发的考生认知加工过程,为教育教学提供更具针对性的指导,优化教学方法和策略,以提升学习者的读写能力,为读写测试的设计和改进提供科学依据,确保测试更加准确地反映学习者的真实水平和认知能力,推动教育评估领域向更加智能化、精准化的方向发展。
2. 文献综述
2.1. 国内研究现状述评
2.1.1. 语言测试学视角为主,应用发掘多于理论探讨
早期国内学者对读写综合写作任务的研究多以语言测试学为切入点,涉及篇章结构、句法复杂性、词汇丰富性、词汇习得、写作成绩等问题,对任务的结果效度进行探讨。
2.1.2. 过程效度研究开始受关注,研究方法以内省法居多
近年来,国内学者开始关注读写综合写作任务过程效度的相关研究。缪海燕[1],以语言输入类型作为切入口,构建出四种各不相同的互动语境,对中国英语学习者在读后续写任务中的语篇协同状况进行了考察。张洁[2]运用受激回溯法,对学习者在不同任务情况下,完成读后续写的整个过程进行了考察。在上述的相关研究中,多数采用内省法之类的方法对学习者的认知加工过程展开质性分析。仅有极少一部分[3]运用击键追踪技术来对体现写作认知活动的行为予以跟踪并进行客观分析。同时,现有的写作过程认知研究主要侧重于独立写作测试,至于综合写作测试的相关研究则刚刚起步。
2.2. 国外研究现状述评
2.2.1. 认知加工模型研究起步较早,读写协同策略有待深入挖掘
在认知加工模型方面,国外研究起步较早,主要涉及独立阅读[4]、独立写作[5]以及综合写作任务[6],其中综合写作任务的认知模型不仅包含了独立阅读和写作两种测试的认知特点,而且涵盖了语篇融合的特点,然而此认知模型并未关注写作过程中考生读与写的协同特点。
2.2.2. 击键追踪技术多用于独立写作测试研究,综合写作测试相关研究有待加强
国外学者将击键追踪技术运用于独立写作测试研究中,主要关注考生写作流畅度、停顿、修订以及文档切换等方面的数据。Miche等[7]使用了键盘记录技术,比较了高水平和低水平的L2托福考生在独立和综合任务上的修订模式,并根据修订的内容(即修订的类型和重点)和时间(即修订在整个文本创作过程中的第一、第二和第三部分的发生时间)进行了比较。因此,基于击键追踪技术的写作过程研究能让研究人员准确记录下写作者的外部文本生成过程。然而,现有的读写综合测试相关研究,并未在实时追踪读写过程的基础上,全面且系统地对考生的认知加工特征展开探究。
3. 研究方法
3.1. 研究问题
本论文主要研究以下问题:1) 被试在完成读写综合任务过程中反映出哪些停顿特征?2) 被试在完成读写综合任务过程中反映出哪些修订特征?3) 被试的停顿和修订特征反映出哪些认知加工过程?
3.2. 研究对象
被试为1名湖北师范大学英语专业二年级的学生,女生,年龄19岁,母语为汉语。
3.3. 研究工具
本研究写作测试选取Tem-4 2021年真题,关于“Loneliness and Wisdom: Are They Related?”。被试被要求阅读一篇短文后,对文章观点进行总结和评价。测试时长为45分钟,字数不少于200字。被试需在计算机上作答,整个过程由击键追踪工具Inputlog 8.0 [8]记录,之后运用刺激回忆访谈法来回溯与之相关的认知加工过程。
3.4. 数据收集与分析
被试的停顿特征主要基于停顿时段(前期、中期和后期)和停顿位置(词内、词间和句间)对停顿次数和停顿时长进行统计,其中前期包含时段1 (0~9分钟),中期包含时段2~4 (10分钟到35分钟),后期包含时段4 (36分钟到45分钟),停顿阈值设定为2秒。被试的修订特征主要从修订层级(词内、句内/句子内、句间/段落间)、修订类型(内容、语言、结构)以及修订操作(添加、删除、替换)三个维度展开分析。
4. 结果
4.1. 基于键盘记录的写作停顿特征
总体而言,如表1所示,被试在词间停顿最为频繁,而句间停顿耗时最久;从时段1到时段4,停顿次数和停顿时长分别呈递增和递减趋势。被试停顿次数/分达到3.65次,停顿总时长占比高达51.78%。停顿次数上,词间最多(69次),句间最少(3次),停顿时长上,句间最长(24.67秒),词内最短(5.34秒)。从各时段来看,被试在时段1停顿最少(13次),随着写作不断进行,次数不断增加,并在时段4达到最高点(30次);而停顿时长则完全呈现出截然相反的变化规律,时段1最久(46.72秒),并逐步减少,时段4最短(5.43秒)。
4.2. 基于键盘记录的写作修订特征
总体上,如表2所示,被试在修订层级上词内修订占比最高(68.8%),句内/句子内修订占比次之(23.4%),句间/段落间修订占比最低(7.8%);从修订类型来看,被试对于语言方面所做的修订最多,其中对于拼写所做的修订占比最高(49.6%);从修订操作来看,被试采取删除的操作占比最高(91.3%)。
Table 1. The pausing features of one candidate in a reading-writing integrated test
表1. 读后综合测试被试写作停顿特征
指标 |
均值 |
停顿次数(每分钟) |
3.65 |
停顿时间占比 |
51.78 |
词内停顿次数 |
17 |
词间停顿次数 |
69 |
句间停顿次数 |
3 |
词内停顿时长(秒) |
5.34 |
词间停顿时长(秒) |
5.78 |
句间停顿时长(秒) |
24.67 |
各写作时段 |
|
时段1停顿次数 |
13 |
时段2停顿次数 |
27 |
时段3停顿次数 |
28 |
时段4停顿次数 |
30 |
时段5停顿次数 |
25 |
时段1停顿时长(秒) |
46.72 |
时段2停顿时长(秒) |
9.71 |
时段3停顿时长(秒) |
7.15 |
时段4停顿时长(秒) |
5.43 |
时段5停顿时长(秒) |
6.82 |
Table 2. The revision features of one candidate in a reading-writing integrated test
表2. 读后综合测试考生写作修订特征
指标 |
数值 |
修订总数 |
145 |
修订层级 |
百分比 |
词内修订 |
68.8 |
从句内/句子内修订 |
23.4 |
句间/段落间修订 |
7.8 |
修订类型 |
|
内容 |
4.5 |
语言 |
|
语法 |
6.5 |
拼写 |
49.6 |
标点 |
1.4 |
短语 |
17.9 |
结构 |
20.1 |
修订操作 |
|
添加 |
3.6 |
删除 |
91.3 |
替换 |
5.1 |
4.3. 基于刺激回忆访谈法的考生认知过程
通过与被试进行刺激回忆访谈,对写作不同阶段停顿和修订特征相对应的认知加工过程进行了解释。
写作前期,被试主要关注写作任务和阅读文本,与停顿相关的加工过程主要有推断、命题信息整合、意义构建、篇章构建等过程,涉及较多的是命题信息整合,如被试提到“我在阅读文本的时候,Dr. Jeste提到了很多关于孤独和智慧关系的论点,我花了很长时间去整合各个论点之间的联系”。
写作中期,考生主要经历了规划、选择、转译、组织和协同等过程。其中,“转译”、“组织”和“协同”频次最高,如考生提到“在写作过程中,很多内容我都是知道中文怎么表达,但用英语表达的时候总会停下来想一想”、“在论述孤独与智慧之间关系的时候总感觉它们之间联系不是很紧密,所以我又反复阅读了文本中提到的内容试图寻找出它们之间的联系”、“在写分论点的时候我想了很久,才选择从两个方面展开,一是聪明人如何做来使自己不孤独;二是孤独如何使人变得愚蠢”。
写作后期,考生主要进行修订,监控语言丰富性、准确性及语篇流畅性。修订过程的停顿旨在确保内容协同和语言表达质量。基于考生在修订层级上词内修订以及采取删除的操作占比最高,说明该考生对于语言表达质量要求较高,尤其是语言丰富性,如考生将“link”修订为“correlation”,将“popular”修订为“prevalent”。
5. 结语
通过分析读后综合任务中考生写作停顿和修订特征,本文厘清了考生在写作过程中的认知加工过程,为读写测试的设计和改进提供科学依据,同时为一线教师的教学内容与方法提供了指引。但本研究被试样本量太小,对研究结果的推广性有一定影响,未来可扩大样本量,运用更多技术手段(如眼动仪)开展读写综合任务的认知过程研究。
基金项目
湖北师范大学2023年度校级教育教学改革研究重点项目(2023020)。