1. 介绍
1.1. 研究背景
1.1.1. 《大学英语课程要求》的培养要求
早在2007年教育部高等教育司就颁布了《大学英语课程要求(试行)》,这一文件对大学生在书面表达能力上的培养要求分为三种:
1) 一般要求:能完成一般性的写作任务,能描述个人经历、观感、情感和发生的事情,能写常见的应用文,能在半小时内就一般性话题或提纲写出不少于120词的短文,内容基本完成,中心思想明确,用词恰当,语意连贯。能掌握基本的写作技能。
2) 较高要求:能基本就一般性的主题发表个人观点,能写所学专业论文的英文摘要,能写所学专业的英语小论文,能描述各种图表,能在半小时内写出不少于160词的短文。
3) 更高要求:能用英语专业所学做简短的报告和论文,能以书面形式比较自如地表达个人观点,能在半小时内写出不少于200词的说明文或议论文,思想表达清楚,内容丰富,文章结构清晰,逻辑性强 [1]。
除此之外,文件明确提出:高校应该充分利用多媒体、网络技术发展带来的契机,改进原来以教师教授为主的单一教学模式。新的教学模式应以现代信息技术,特别是网络技术为支撑,使英语教学朝着个性化学习,不受时间和地点限制地学习,主动学习的方向发展。事实上,在未全面开设大学英语写作课程的学校中,利用网络和机器评阅英语作文为教师的英语教学减少了压力,也为学生在课堂之外提高英语写作能力提供了途径。
1.1.2. 大学生英语写作的现状
我国大学英语写作教学过程中,一直运用以教师为中心的教学模式,整个教学活动推进的过程中,教师充当的都是知识的讲解者和灌输者。这种英语教学模式要求教师在课前和课后花费大量的时间进行准备和作文批阅,同时还需要在课堂中为学生进行反复地讲解。
然而对于没有专门开设写作课程的学生来说,给予他们专门英语写作的时间并不多。而且学生人数多,教学任务重,学生只是按照教师所布置的写作任务和要求,大部分学生对于英语作文写作更加重视分数高低,线上写作平台的出现在一定程度上缓解了教师的工作量。但是大学生们的英语写作依然很容易流于形式。在有限的时间内,提高学生的写作能力和效率势在必行。
所以针对时下流行的英语写作自动评阅平台机评反馈与教师的批改反馈相比,他们是否能够真正提高学生的英语写作能力?更重要的是,学生对于两种反馈的内化程度又如何?这些问题需要得到研究和探索。由于篇幅所限,本文将着重探讨第一个问题。
1.2. 研究目的和意义
根据大学英语课程要求对高校学生书面表达能力的要求以及我国大学生英语写作现状,笔者希望通过以时下运用广泛的自动批改平台iWrite英语写作教学与评阅系统为研究工具,将其对大学生的写作文本的机评反馈与教师的批改反馈进行对比研究,基于社会文化理论下的最近发展区、支架和内化三个概念为核心,探寻这两种反馈是否能够真正提高学生的英语写作能力。从而进一步探究有效的反馈方式来提高大学生的英语写作能力,并丰富社会文化理论在英语写作中的应用实践。
2. 理论支撑
受马克思主义辩证法的启发,维果斯基建立了社会文化理论,基于发展观和历史剖析人类心理机能发展机制的社会文化属性,他认为人由社会文化历史发展形成的高级心理机能是由作为生物进化结果的低级心理机能基础上产生的,是历史的产物 [2]。
2.1. 内化
内化是个体高级心理机能发生和发展的机制,是指个体在社会交际活动中将社会平台的行为和思维方式转化到个体心理平台,从而调节自身行为和思维方式的发展过程。社会环境和社会交际是个体高级心理机能发展的关键 [3]。在发布作文任务后,研究者将严禁学生抄袭作文,将两种批改反馈传递给学生后,督促学生进行修改和消化,帮助学生最大程度学习到写作知识。
2.2. 最近发展区
最近发展区理论是指个体的发展有两个层次。一个是现有的实际发展水平,指的是个体独立解决问题时所展现的水平,另一个是潜在的发展水平,指在他人引导下能达到的更高一层的解决问题的水平。上述两个水平之间的差距即为最近发展区。所以研究者要通过半结构化访谈来了解学生现有的发展水平和预期达到的水平等。在此基础上,为学生设定较高的发展水平目标并最大程度提供给学生能够达到潜在发展水平的写作帮助,指导学生缩小两种发展水平的差距,不断靠近潜在的发展水平。
2.3. 支架
国内外学者对支架的界定为:教师在与学习者互动中为学习者提供支架,帮助其掌握新知识和技能并实现自我调节的过程。根据已有研究,支架的作用在与维持既定目标、提高学习者参与度、纠正反馈、提供解释和示范法等四个方面。总体来说,为学生提供清晰的学习方向、及时给与学生相关评价、提高学习效率等。所以在进行实验任务之前,研究者会进行半结构化访谈调查来了解学生所喜爱的反馈方式来提供更加适合学生的教师反馈和机评反馈方式。
3. 两种反馈的定义
3.1. 教师反馈
在教学环境中,反馈是指为了改进、提高学生的学习而对其某一学习任务的完成情况发回的信息。在写作教学中,反馈是指读者为作者提供修改作文的信息,能够促使学习者注意到中介语和目的之间的差异,促使学习者重新构建出对目的语所形成的假设,对语言结构进行重组。这种重组会出现在其语言产出的过程中,并在以后输出的过程中得到验证。反馈可以促使学习者修正不正确的假设,达到解决问题的目的。根据来源,反馈可以分为教师反馈,同伴反馈,自我反馈,机器反馈等。
教师反馈在写作方面主要包括:针对学习者作文表层错误的纠正性反馈,也就是语言形式反馈;面向作文语篇层面的反馈,也可称之为思想内容的反馈;教师的评论和总体评分等。
教师反馈中的纠正性反馈根据风格可以分为直接纠正反馈和间接纠正反馈。对与学生可以独立解决的问题,可以采用间接纠正反馈方式;对于学生无法独立解决的问题,可以采用直接反馈方式。即给学生指明错误的地方,并给正确的语言形式,而间接反馈相反,学生要自己更正自己错误。根据纠错方法的综合性和全面性,可以分为焦点式和非焦点式反馈。非焦点式反馈也叫综合性纠正反馈,也就值指出学习者作文中的所有类型的错误。而焦点式反馈也被成为选择性反馈,即焦点之外的错误不予以关注或者纠正。
3.2. iWrite英语写作教学与评阅系统
英语写作自动评价系统建立在建构主义理论,形成性评价理论和过程写作法理论上的利用计算机技术对作文进行评估和计分的系统 [4]。由外研社和北京外国语大学梁茂成教授及其团队共同研发的iWrite英语写作教学与评阅系统可以为作文的语言、内容、篇章结构和技术规范四个维度进行评分,并给与作文评价。这一平台综合第二语言写作、语料库、自然语言处理等领域的研究成果,可以提供多元化的写作任务和个性化的题库建设。可想而知,在大班额无专门写作课的教学条件下,iWrite为大学英语写作提供了诸多便利。在PC端和电脑端都可以操作这一平台,这为教师发布写作任务和学生灵活完成任务提供了便利。最重要的是它能为学生提供智能化和及时性的作文批改反馈 [5]。
4. 国内外对教师反馈和机评反馈的研究综述
4.1. 国内外对教师反馈的研究概述
国外的教师反馈研究始于上世纪八十年代后期到九十年代早期。教师反馈可以提高学生的写作能力不被认可。甚至有学者强烈反对教师纠正学生作文中的错误 [6] [7]。他们认为教师的反馈含糊不清,过于武断,在写作教学中收效甚微,不仅不能纠正学生语言的准确性,也不利于促进学生写作的流利性和提高写作质量。但也有很多学者持相反的意见,他们认为教师反馈有助于帮助学习者提高写作水平 [8] [9]。
近十年来,众多学者排除母语为英语的研究对象,将母语为阿拉伯语、中文、印度尼西亚语的学生为研究对象,探究他们二语写作中教师纠正的效果影响 [10] [11] [12]。大多数研究结果都对教师反馈的效果呈积极态度,但对直接纠正反馈和间接纠正反馈的效果各有偏向。也有学者对教师的反馈提出质疑,认为教师反复批改作文会逐渐对错误麻木,对类似的工作感到疲惫和枯燥,甚至会因疲于应对学生作文中的诸多错误,而造成错误的纠正。过多的批改痕迹和信息会造成学生的消极情绪 [13]。也有对机器辅助写作反馈和教师纠正性反馈的对比研究表明后者在提高作文的内容和组织结构上优于“Grammarly”这一帮助提升写作的平台 [14]。
国内对教师反馈的研究一般为实证研究,大部分研究对教师反馈有助于提高中国英语学习者的写作准确性持积极态度,并把研究的重点放在对不同对象的反馈效果研究以及二语写作中教师的各种反馈形式和内容如何影响反馈效果。
研究者们研究的对象一般可以分为中学生和大学生。例如她们利用教师直接反馈和间接反馈对不同水平的高中生的写作准确性进行研究。得出结论两种反馈对高水平的学生没有优劣之分,而对低水平学习者,直接反馈的效果更佳。但也有研究从反馈的延迟效果上探究得出,虽然短时间内直接反馈的效果更好,但间接反馈可以给学生提供自己思考问题并纠正的机会 [15]。也有研究称间接反馈确实效果更好,但不认同这一反馈形式可以提高学生的自主性 [16]。在对大学生的研究中,写作文本在不同反馈方式影响下句法复杂度被加以探究。对学生错误提供正确的语言形式并附加正确的语法说明,提高反馈的针对性,诸如此类的反馈细节被推崇 [17]。
所以从整体上看,早期的国外侧重对教师反馈有效性的研究。而近年来国内外的研究开始倾向于对不同反馈形式效果的对比研究,针对的研究对象也均有所不同。
4.2. 国内外对机评反馈系统的研究概述
国外对机评反馈系统的研究发展始于上世纪60年代,主要研究的反馈系统典型代表有Page Essay Grade (PEG),Intelligent Essay Assessor (IEA),Electronic Essay Rater (Erater)等。他们或是对文本的表征特征有所侧重,或是更倾向于对文本内容的分析。随着技术的发展,Educational Essay Assessor (IEA)和E-rater将系统分析的重点进行了完备,放在了语言、内容和篇章结构和整体评分上,后者还被应用于GMAT考试的写作评分上等。进入二十一世纪以来,有研究开始从跨学科的视角详细描述自动评分系统如何辅助课堂教学,如何提高学生的写作水平等。渐渐地,机评反馈系统逐渐被应用与课程的形成性评价之中,除了自动评分之外,还具备了对作文的错误分析,维度分析和个性化反馈及写作辅助等功能。主要代表有:My Access!, Criterion, Writing Roadmap (WRM) [18]。
国外的英语机评反馈系统主要针对英语本族语使用者,并不适用于像中国学生这种英语为第二外语的学习者。所以国内的自动作文评分系统应运而生,主要有高等教育出版社和清华大学开发的体验英语写作教学资源平台,北京词网科技有限公司开发的批改网;浙江大学外国语言文化与国家交流学院研发的冰果英语智能作文评阅系统;外语教学与研究出版社开发的Unipus旗下电子产品iWrite英语写作教学与评阅系统等。国内对英语作文自动评分系统的研究经历了基本原理的研究 [19] [20],对系统的改进加工 [21],实证研究和信度效度评估等 [22]。在实证研究中,多位研究者对国内的英语作文自动评价系统都给出了积极的评价,尤其是依托句酷批改网的研究最多。他们表明这一系统能够培养学生的自主写作能力,激发学生写作兴趣等 [23] [24] [25]。然而在多个英语作文机评系统的对比中,句酷批改网在评分板块使用的语料过于陈旧,对错误的识别不够准确;点评的针对性不高,缺少对文章内容和机构的评判;功能不够稳定,整体利用率有待提高等问题。
整体上,本文和过去对教师反馈和机评反馈研究的不同落脚点在于:
1) 研究背景不同。本研究以没有参与专门开设大学英语写作课程的大学生展开,试图探究在独立完成写作任务的前提下,机评反馈和教师反馈分别作用下,学生的写作语言能力是否有变化。
2) 过去的研究将机评系统限制在:句酷批改网、冰果智能评阅系统、《新视野大学英语》作文自动评分系统等。本文将采用研究较少,发展相对较为成熟的,具有较高信度的iWrite英语写作教学与评阅系统为机评系统。
3) 在理论选择上,以往的研究多采用过程写作理论、输入与输出假说以及合作理论为理论基础。对没有接受专门开设写作课程的学生来讲,这几个教学理论实践起来在一定程度上存在困难。近年来,一些学者为了解决这一问题,选取了一个新的理论基础,即社会文化理论,本文将采用社会文化理论为理论支撑来进行研究。
5. 研究设计
5.1. 研究问题
本文的研究问题是:在iWrite英语评阅系统机评反馈和教师反馈的分别作用下,学生的英语写作能力是否有变化?
5.2. 研究对象
本研究选取的研究对象为未参与专门英语写作课程的中国大连某高校非英语专业大一学生。研究者将六十名学生随机分成两个班。根据大学英语分级教学的要求和安排,两个班级接受的都是大学英语2级的课程。另外,两班的教学计划,使用的教材和任课老师均相同。需要说明的是,本文中实验对象的任课教师具有多年大学英语课程教学经验。该名老师以大学英语四级的评分标准为依托对写作文本进行整体评分,并参考山东大学王颖老师总结的错误分类方法对学生的文本进行识别修正。在整个过程中尽量避免情感等主观因素干扰批改的顺利进行以保证教师评阅的准确性和客观性。在科学的批阅前提下,本文的研究忽略不同教师间的个体差异。在实验前,研究者首先对两个班的学生布置了一个写作任务作为前测。将两个班级学生的前测成绩经独立样本T检验得出两班英语写作水平无显著性差异(p = 0.952 > 0.05)。
5.3. 研究方法和流程
本文的研究将采用半结构化访谈法和文本分析法。研究者将从两班中随机各抽取2人进行半结构化访谈来收集学生对自身个人英语写作能力的评估和预期达到的水平、写作的主题倾向和对反馈的偏好等信息。研究者将采用文本分析法分析学生的文本,利用客观性评估方法来分别总结由学生的前测和后侧体现出的写作语言能力的变化,并通过举例来分析学生对反馈的内化程度等。
整个实验过程将持续九周,从第一周开始布置写作任务后,每隔一周向两组学生同时布置相同的写作任务,共五篇作文任务。每篇作文的主题选自历年大学英语四级作文题库。其中一班写作文本仅接受iWrite机评反馈。二班写作文本在iWrite平台关闭机评的前提下,仅接受教师反馈。两组学生在每次分别接受不同的反馈后,会对自己的作文文本进行修改,生成修改稿。再次反馈给机器和教师,分别重新接新的反馈改正。
6. 数据收集和处理
实验结束后收集所有文本进行分析。一方面包括三个班级所有写作任务的初稿和接受反馈后的修改稿、以及前后测的文本共420篇。研究者会将所有的文本放在WPS 2019这一软件下的Word程序中,对文本的错误、句子、词汇等进行标记并汇总等。另一方面数据也包括参与半结构化访谈的学生访谈内容。
6.1. 半结构化访谈
在进行前测前,研究者随机从两个班级中各抽取两位学生。通过半结构化访谈了解学生目前的写作能力水平、预期达到水平、写作主题倾向以及反馈偏好等。访谈大纲如表1所示:
Table 1. The outline of semi-structured Interview
表1. 半结构化访谈大纲
总体上看,在对四个同学的访谈中,他们都认可了英语写作在英语学习的重要性。但也都表示会在写作的词汇的丰富度和篇章结构的安排上有所欠缺,主要存在的问题有:词汇量较少、词性记错;不会利用新的句型来丰富自己的文章内容;在文章的内容衔接上也有所欠缺等。但被问及什么样的写作主题是其所倾向的。他们表示热门时事,环境保护以及传统文化相关主题的写作话题是他们所青睐的。访谈对象1表示,这几类话题在考试中出现频率较高,在日常生活中的练习可以视为一种备考;访谈对象2表示,以时事热点为主题的议论文可以锻炼辩证性思维,还可以扩大自己的词汇量。四位同学都表示,希望自己在英语写作水平上有所提升,起码避免基本的语法错误和掌握核心的写作技巧。尤其是访谈对象3表示,在不打草稿的前提下,自己如果能直接写出一篇没有错误的文章会更好。
四位同学都表示希望自己的写作文本能够得到修正。访谈对象1和访谈对象4表示很期待接受到全面且详尽的反馈,侧重于收到机器反馈给出的结果。另外两个对象希望能够收到教师的反馈。他们认为教师的反馈会更加专业和具体,也会更有针对性。
从访谈的结果中研究者可以找出学生的最近发展区来帮助学生确定近期发展目标为夯实英语词汇和语法基础,明晰作文的结构安排并加强写作的内容逻辑。据此,教师需要在实验过程中,反复强调词汇和语法的重要性,鼓励学生在课堂内外通过各种英语学习方式或渠道精进自己的基础知识和写作技巧。除此之外,督促学生认真对待并消化老师或者机器给予反馈和修改建议,努力提高自己的英语写作水平。
6.2. 客观性评估结果
笔者参考众多学者和山东大学王颖老师汇总整理的客观性分析方法基础上,对两个班级前测和后测的文本分别从流利度、准确度和文本复杂度三个维度利用SPSS软件进行分析。由于客观性评估的各组数据并未被验证是否符合正态分布,所以Wilcoxon Signed Ranks将用来比较每班学生前后测各项数据的变化情况,而两班之间的流利性、准确性和复杂性的变化将采用非参数检验法——Manner Whitney U检验。结果如下表2、表3和表4所示:
Table 2. Wilcoxon test of objective evaluation score in pretest and post-test in class one
表2. 一班前后测客观性评估分数的Wilcoxon检验
Table 3. Wilcoxon test of objective evaluation score in pretest and post-test in class two
表3. 二班前后测客观性评估分数的Wilcoxon检验
Table 4. Mann Whitney U test of objective evaluation score in pretest and post-test for two classes
表4. 两班前测和后测客观性评估分数的Mann Whitney U检验
一班前后测作文的初稿的客观性评估分数的Wilcoxon检验结果显示,该班流利性W/C (Z= −4.19; p = 0.00)、准确性中EFT/T (Z = −2.43; p = 0.02)、复杂性中C/T (Z = −3.73; p = 0.03)和DC/C (Z = −3.73; p = 0.00)的数值有了显著性差异。流利性的W/T和W/EFT、准确性E/T没有显著性差异。而二班除了流利性中W/T (Z = 1.35, p = 0.18)的数值没有显著性差异外,其他各项标准的分数都有了显著性差异。
一班和二班第一次写作任务初稿的客观性评估分数的Mann Whitney U检验结果显示,两组第一次作文初稿的客观性评估的七个指标均没有显著性差异。而第五次写作任务初稿的客观性评估分数的Mann Whitney U检验结果显示,两组流利性W/EFT (U = 265.00, p = 0.01)、准确性EFT/T (U = 228.00, p = 0.00)、E/T (U = 197.00, p = 0.00)具有显著性差异。而流利中W/T、W/C和复杂性C/T和DC/C四项指标没有显著差异。
7. 讨论
一班学生在仅接受机评的情况下,流利性(W/C, W/T)有了显著性变化。这说明机评提供了促进学生语言使用自动化的机会。在机评的提示下,学生有意关注文本的衔接和连贯。同时,准确性(EFT/T)指标的显著性变化体现出机评对文本的词汇,句型和固定搭配的纠正有效性。学生有意避免错误的表达来提高文本的准确性。而复杂性(C/T, DC/T)显著性变化也说明了机评反馈的内容对学生的句子丰富度有一定的影响,能够引导学生丰富自己的表达。
二班的学生流利性指标(W/C, W/EFT)和准确性指标(EFT/T, E/T)均有了显著性提高。这说明学生收到教师的反馈后会利用自己现有的知识或在现有知识的基础上产生一些新知识来修改作文中的错误。他们会反省产生错误的原因也是语言学习过程中心理语言学的一个阶段。复杂性(C/T, DC/T)的显著性变化说明学生会接受教师的反馈从而关注写作文本的内容是否丰富。
两班的学生文本复杂性两个指标(C/T, DC/C)在实验结束后均有显著性变化,但两班之间没有明显差异。这说明在两班学生接受iWrite机评和教师的反馈后,除了注重提高自己写作文本的准确性和流利性,还有意识地加强自己的文本复杂度。更说明了无论是教师还是iWrite机评在提高学生的文本复杂性方面的能力不相上下。
总体上,通过实验后的客观性评估各项指标分析可以得出研究者在学生实验前为其设置的最近发展目标基本达到。两个班学生的英语写作能力,其中包括写作文本的准确性,流利行和复杂性均有所提高。
8. 结论
本文以社会文化理论为理论支撑,在实验初期通过访谈了解学生的最近发展区,以两种形式的反馈为支架,在老师督促下通过学生自主消化修改作为知识内化的手段等,帮助探寻iWrite和教师反馈对学生的英语写作能力是否有影响。通过实验得出结果显示教师的纠正反馈和iWrite机评反馈都有益于学生写作能力的提高。它们的反馈能够促使学生认识到正确的语言形式并对比自己中介语与目标语的不同。通过进一步的文本分析,也看出iWrite的反馈在语言形式和技术规范方面效果更好。教师的反馈更关注学生的整体评价和细节上的错误。整体上来看,iWrite这一平台有着能够媲美教师反馈的评阅能力。因此,未来很有可能完全代替教师对大学生的英语写作文本进行有效地反馈。毋庸置疑,在英语写作教学过程中,如果教师和学生都有足够的时间和精力,针对学生的写作文本,iWrite机评和教师的结合反馈效果会更好。