1. 引言
认知控制(cognitive control),被称作人类认知中最令人着迷的奥秘之一,是个体在实时更新的情景信息中,对认知和行为进行动态的、过程性的调控,以完成特定目标任务的心理过程(Geier, 2013)。认知控制是一个依赖动机的过程,奖励作为动机因素之一对认知控制起着重要作用(Cubillo, Makwana, & Hare, 2019)。双重认知控制理论(Dual mechanisms of cognitive control account, DMC)将认知控制分为主动性控制(proactive control)和反应性控制(reactive control) (Locke & Braver, 2008),个体可根据具体的任务情境和自身情况在两种认知控制方式之间进行权衡与转换,形成有利于当前任务表现的最有效控制模式(Amer, Campbell, & Hasher, 2016)。主动性控制是早期选择的过程,在事件发生前持续激活和保持目标相关信息,形成反应准备,预测认知冲突;反应性控制是晚期纠正过程,根据需求短暂地再激活先前的线索信息,即时解决认知冲突(Braver, 2012)。
研究认知控制权衡常采用AX-CPT范式(AX-continuous performance text),该范式是持续型操作测验(CPT)的改进版,它能够将主动性控制和反应性控制进行分离(周璇,苗天长,2014)。该任务中,主动性控制表现为BX序列的反应时减小和正确率提高(或AY序列的反应时增加、正确率降低),反应性控制表现为AY序列的反应时减小和正确率提高(或BX序列的反应时增加、正确率降低) (徐雷,唐丹丹,陈安涛,2012)。随着认知神经科学的进步,关于认知控制权衡的研究逐渐深入到脑机制层面。由于ERP技术具有高时间分辨率的特点,能够在时间进程上精确地刻画认知加工过程,被广泛应用于认知控制的研究中(刘勋,吴艳红等,2011)。ERP研究表明,分布在额中央区的N2成分(200~300 ms)表示反应性控制,反映了冲突监控,监测由无关刺激信息处理触发的反应冲突;分布在中-顶区域的P3成分(300~600 ms)表示主动性控制,与情境分析和克服强烈反应倾向所需的注意力资源分配有关(Incagli, Tarantino, & Crescentini, 2020; Schmitt, Ferdinand, & Kray, 2015;谭金凤,伍珊珊等,2013)。
以往研究表明,由于认知控制权衡是灵活动态的,因此会受到奖励动机等因素的影响。奖励可以加强个体反应前的准备,影响认知控制权衡,提高主动性控制。近年来,国外已有研究者探讨了绩效奖励和非绩效奖励对认知控制权衡产生的影响。绩效奖励是指根据被试在任务中的表现给予奖励;非绩效奖励是指只要被试完成任务就会获得一定奖励(兰维,高德胜,1997)。但是,因为目前相关的研究较少,这两种奖励以主动性控制还是反应性控制的方式作用于认知控制还没有得出统一的结论。比如,Fröber, Dreisbach (2014)发现,绩效奖励提高主动性控制,非绩效奖励直接或间接地影响反应性控制。基于此,我们决定借助事件相关电位技术(ERP),从行为和神经机制两方面进一步探讨绩效和非绩效奖励如何对认知控制权衡产生影响。我们假设,绩效奖励和非绩效奖励都能促进认知控制权衡,绩效奖励提高主动性控制,非绩效奖励提高反应性控制。
2. 方法
2.1. 被试
以Q大学20名女大学生为研究对象,所有被试自愿参与本实验,均为右利手,视力正常或矫正视力正常,身体健康且无神经系统疾病,在实验前签署知情同意书。实验完成后,将给予每名被试一定报酬(将游戏积分转换成真实的金钱,兑换相应价值的礼物)。在ERP数据分析时,由于伪迹过多和数据损坏等原因,剔除5名被试,最终有效被试15人。
2.2. 实验任务和材料
本实验采用认知控制权衡领域使用最为广泛的AX-CPT范式,使用E-prime3.0软件呈现刺激和记录行为数据。刺激呈现在白色背景的24英寸DELL显示器上,显示参数分别为:刷新率59 HZ,分辨率1920 × 1080。
AX-CPT范式的刺激为四个黑色大写英文字母A、B、X、Y (70号,Courier New字体),这些字母在白色屏幕中央单个依次呈现。该任务包含线索刺激(A或B)和探测刺激(X或Y),要求被试尽可能又快又准地进行按键反应。当靶刺激AX出现时,用右手食指按“J”键,当非靶刺激AY、BX、BY出现时,用左手食指按“F”键。其中AX序列占70%,AY、BX、BY序列各占10%。之所以设置高频率的AX序列,是为了使被试产生认知冲突,即当看到靶刺激(A或X)时会有较强的靶反应倾向(徐雷,唐丹丹,陈安涛,2012)。因此,需要加强认知控制才能解决认知冲突。本实验为了增加趣味性,调动被试积极性,将AX-CPT范式以黄金矿工的游戏形式呈现。由于该实验纳入了基线、非绩效奖励、绩效奖励三种奖励条件,因此,会在AX-CPT任务之后呈现奖励相关反馈,不同奖励条件下,反馈的形式不同。
2.3. 实验设计和程序
实验采用2 (奖励条件:非绩效奖励、绩效奖励) × 2 (字母序列:AY、BX)两因素被试内设计,奖励条件为组间变量,字母序列为组内变量。因变量为字母序列的正确率和反应时。
首先,被试佩戴好电极帽后舒适的坐在无噪音、光线柔和的实验里,眼睛距离屏幕约50 cm。任务开始后,先呈现十字注视点(500 ms),紧接着呈现100 ms的空白掩蔽,之后呈现线索刺激(300 ms)、空白(1000 ms)、探测刺激(2000 ms)、反馈(2000 ms),要求被试在探测刺激呈现时开始反应,超过反应时限2000 ms未做出反应,将视为反应错误自动跳过。在奖励版AX-CPT任务中当被试做出反应按键后,会立即呈现一个奖励相关反馈(1500 ms),之后出现十字注视点进入下一个试次(见图1)。基线(无奖励)条件的反馈为:蓝色的“正确!”和红色的“错误!”;非绩效奖励条件的反馈为:蓝色的“正确!恭喜你挖到了金子 + 100”和红色的“很遗憾!你挖到了石头 + 100”,“你目前获得的金矿总价值为:”;绩效奖励条件的反馈为:蓝色的“正确!恭喜你挖到了金子 + 100”和红色的“很遗憾!你挖到了石头 + 0”,“你目前获得的金矿总价值为:”。其中,基线条件下,被试只是单纯的完成AX-CPT范式,而在非绩效和绩效奖励条件下,通过指导语告知被试该阶段会出现奖励以及获得奖励的规则。
三种奖励条件各100个试次,其中,AX序列为70次,AY、BX、BY序列各10个试次,试次的顺序随机排列。在正式实验前,每个被试先进行5个试次的练习实验,可按“Q”键重复练习,直到被试熟悉了按键任务才能进行正式实验,整个实验总时长约为40分钟。
(a) 基线
(b) 非绩效奖励
(c) 绩效奖励
Figure 1. Flow chart of the experiment
图1. 实验流程图
2.4. 事件相关电位技术(ERP)的记录和分析
实验仪器为 Brain Products 公司的脑电记录和分析系统,参考电极置于双侧乳突,接地点在前额FPZ和FZ中点。采⽤64导电极帽记录EEG,同时记录⽔平眼电(HEOG)和垂直眼电(VEOG)。实验前在各电极注入导电膏。每个电极处的头⽪电阻保持在5 kΩ以下,滤波带通为0.05 Hz~80 Hz,连续采样,采样频率为500 Hz (燕智玲,李红,2011)。
采用Brain Vision Analyzer 2.2离线分析软件对两种奖励条件下(非绩效奖励、绩效奖励)的认知控制权衡EEG数据进⾏统计分析,选取1000 ms的分析时间窗(目标刺激出现后800 ms作为分析时程,刺激出现前200 ms为基线),自动校正眼电并排除其他伪迹,波幅大于±80 μv在叠加时被自动剔除。参照已有研究和本研究目的,选取与认知控制权衡相关的N2 (200~300 ms)、P3 (300~600 ms)成分进行统计分析,依照以往关于认知控制权衡生理机制的研究文献和地形图选取FZ、CZ、FCZ,3个电极点对N2成分进行分析,选取PZ、CPZ、CZ,3个电极点对P3成分进行分析。运用SPSS24.0统计软件包,对被试正确反应的反应时结果,以及N2、P3的平均波幅进行2 (奖励条件:非绩效奖励、绩效奖励) × 2 (字母序列:AY、BX)的两因素重复测量方差分析(ANOVA),组间变量为奖励条件,组内变量为字母序列。对不满足球形检验假设的采用Greenhouse-Geisser法校正P值,事后比较使用LSD检验,显著阈值α = 0.05。脑电地形图由64导数据得出。
3. 结果
3.1. 行为实验结果
在AX-CPT任务中,AY序列反映了反应性控制,BX序列反映了主动性控制。为考察奖励对认知控制权衡的影响,我们将只关注绩效奖励和非绩效奖励在AY和BX序列上的行为表现(反应时、正确率)。
3.1.1. 奖励有效性和练习效应分析
前人研究表明,被试反应表现的提高存在两种情况:一是外在奖励导致的反应时减少,二是被试害怕漏报导致的反应增快现象。为了考察本实验中奖励设置的有效性,我们分析了被试回答正确条件下的平均反应时。如果被试在奖励条件(非绩效奖励、绩效奖励)和基线条件下的反应时有显著差异,则表明是奖励促进了被试的反应速度,否则,我们认为被试因害怕漏报而采用了反应策略,奖励设置无效(赵瑞芳,2010)。
以被试回答正确的反应时为因变量,进行3 (有无奖励:基线、非绩效奖励、绩效奖励) × 2 (字母序列:AY、BX)两因素重复测量方差分析,结果发现:奖励条件的主效应显著,F(2,19) = 4.102,P < 0.05,η2 = 0.02;奖励条件(绩效奖励、非绩效奖励)的正确反应速度均快于无奖励条件(基线)的正确反应速度。说明奖励的设置是有效的,奖励导致被试的反应速度加快,提高了任务表现。
由于研究程序的设置是顺序式的,即基线block-非绩效奖励block-绩效奖励block,并且都是完成AX-CPT任务,因此被试反应速度的提高也可能是练习效应导致的。结果发现,有无奖励(基线、非绩效奖励、绩效奖励)与字母序列(AY、BX)的反应时交互作用不显著,F(2,19) = 9.44,P > 0.05,η2= 0.59。表明练习引起的反应速度提高对所有奖励条件和字母序列的影响是一致的,而非选择性的影响某一条件或序列。因此,在本实验中,练习效应是一个相对稳定的额外变量,不会影响研究结果(徐雷,王丽君,赵远方,谭金凤,陈安涛,2014)。
3.1.2. 奖励的认知控制权衡
根据已有研究(章鹏,张琪涵,李士一,宋璐,杨宇,白学军,2020;Muscarella, Mairesse, & Hughes, 2020),行为数据反应时分析剔除反应错误的试次和反应时小于100 ms或大于1500 ms的数据,正确率分析剔除了反应时小于100 ms的数据。按照2 (奖励条件:非绩效奖励、绩效奖励) × 2 (字母序列:AY、BX)的实验设计,计算了两种奖励条件下AY、BX字母序列的平均反应时和正确率。
对两种奖励条件的平均反应时进行两因素重复测量方差分析,结果表明,字母序列的主效应显著,绩效奖励、非绩效奖励在BX序列上的表现均好于在AY序列上的表现,F(1,19) = 234.854,P < 0.05,η2= 0.33;奖励条件的主效应不显著;字母序列和奖励条件的交互作用不显著。两种奖励条件在AY、BX序列上的平均反应时见图2。
对两种奖励条件的正确率进行的重复测量方差分析结果表明,字母序列的主效应显著,绩效奖励、非绩效奖励在BX序列上的表现均好于在AY序列上的表现,F(1,19) = 90.559,P < 0.05,η2= 0.14;奖励条件的主效应不显著;字母序列和奖励条件的交互作用显著,F(2,19) = 4.851,P < 0.05,η2= 0.02。简单效应分析显示:非绩效奖励BX序列的正确率(0.99 ± 0.01)高于绩效奖励BX序列的正确率(0.97 ± 0.01)。两种奖励条件在AY、BX序列上的正确率见图3。
![](//html.hanspub.org/file/11-1132307x12_hanspub.png)
Figure 2. The response times of different reward conditions in AY and BX sequences
图2. 不同奖励条件在AY、BX序列的反应时
![](//html.hanspub.org/file/11-1132307x13_hanspub.png)
Figure 3. The accuracy of different reward conditions in AY and BX sequence
图3. 不同奖励条件在AY、BX序列的正确率
3.2. ERP结果
本研究目的是通过事件相关电位技术,进一步证明绩效奖励和非绩效奖励条件的认知控制权衡。根据以往AX-CPT范式的认知控制权衡ERP研究,我们采用额中央区的N2成分(FZ、FCZ、CZ)和中顶部的P3成分(CZ、PZ、CPZ)作为ERP指标。
3.2.1. N2成分
在200~300 ms时间窗口内,对奖励条件的平均振幅进行2 (奖励条件:绩效奖励、非绩效奖励) × 4 (字母序列:AX、AY、BX、BY)的重复测量方差分析。结果显示:字母序列的主效应显著,F(3,14) = 7.843,P < 0.05,η2= 0.15,绩效奖励、非绩效奖励AY序列较BX序列的N2波峰更负;奖励条件的主效应不显著;字母序列与奖励条件的交互作用不显著。绩效奖励、非绩效奖励N2成分上AY和BX序列的平均振幅和地形图如图4(a)、图4(c)所示。
3.2.2. P3成分
在300~600 ms时间窗口内,对奖励条件的平均振幅进行2 (奖励条件:绩效奖励、非绩效奖励) × 4 (字母序列:AX、AY、BX、BY)的重复测量方差分析。结果显示:字母序列的主效应显著,F(3,14) = 8.015,P < 0.05,η2 = 0.15,绩效奖励、非绩效奖励BX序列较AY序列的P3波峰更正(如图4(b)、图4(d)所示);奖励条件的主效应显著,F(3,14) = 6.591,P < 0.05,η2 = 0.13,绩效奖励在四种字母序列上的P3振幅大于非绩效奖励;字母序列与奖励条件的交互作用不显著。绩效奖励、非绩效奖励P3成分上AY和BX序列的平均振幅和地形图如图4(b)、图4(d)所示。
(a)
(b)
(c)
(d)
Figure 4. (a) Average ERP and scalp topography of the AY and BX sequences of non-performance reward on the N200 component; (b) Average ERP and scalp topography of the AY and BX sequences of non-performance reward on the P300 component; (c) Average ERP and scalp topography of the AY and BX sequences of performance reward on the N200 component; (d) Average ERP and scalp topography of the AY and BX sequences of performance reward on the P300 component
图4. (a) 非绩效奖励在N200成分上AY、BX序列的平均ERP和头皮地形图;(b) 非绩效奖励在P300成分上AY、BX序列的平均ERP和头皮地形图;(c) 绩效奖励在N200成分上AY、BX序列的平均ERP和头皮地形图;(d) 绩效奖励在P300成分上AY、BX序列的平均ERP和头皮地形图
4. 讨论
本研究借助ERP技术,从行为、神经生理成分两方面探讨了绩效奖励和非绩效奖励对认知控制权衡的影响。结果表明,绩效奖励和非绩效奖励均能调节认知控制的权衡,提高主动性控制。
行为结果发现,绩效奖励和非绩效奖励在BX序列的反应时、正确率表现均好于AY序列,说明这两种奖励都能调节认知控制权衡,使被试偏向主动性控制。奖励的激励效应,通常表现为反应时的减少和正确率的增加。当目标刺激与奖励联结时,能够吸引注意资源,进而易化注意选择过程,并且这种自上而下的由目标驱动的有意识注意选择能够减少无关刺激的干扰(范玲霞,齐森青等,2014)。由此可见,绩效奖励和非绩效奖励是通过“自上而下”的方式提高了反应准备状态和奖赏预期,增加对后续任务目标的注意,促进了主动性控制。
ERP结果进一步证实了行为结果。关于认知控制的ERP研究表明,N2反映了冲突的评估和监测能力,监测由无关刺激信息处理触发的反应冲突;P3与任务相关信息的维护、反应抑制、奖励动机和克服强烈反应倾向所需的注意力资源分配有关(Muscarella, Hughes, et al., 2020; Giustiniani, Nicolier, Mayer et al., 2020; 蒋军,向玲等,2014)。我们的结果得出:在N2成分上,绩效奖励和非绩效奖励BX序列比AY序列诱发了更小的振幅,说明大脑监测到反应冲突,分配了更多的认知资源进行冲突控制,降低了冲突相关的激活程度;在P3成分上,绩效奖励和非绩效奖励BX序列比AY序列诱发了更大的振幅,说明投入了更多的认知资源对目标信息进行适当的更新和维持,对认知冲突的到来进行了充分的反应准备,以更好地进行认知控制。因此,ERP结果也体现了绩效奖励和非绩效奖励主动性控制的增强。但是,N2和P3成分是否能够完全将反应性控制和主动性控制分开还需要大量研究进一步验证。
我们的研究结果得出,绩效奖励提高了主动性控制,这与众多前人的研究结果一致。在日常的学习、工作和生活中,绩效奖励无处不在。根据被试的表现给予报酬,可以增强奖励情境和被试的动机(章鹏,张琪涵,李士一等,2020)。这其中是因为,被试为了获得更多的奖励,增强了对奖励线索信息的注意投入,一直在头脑中不断保持线索信息,为探测信息的到来做好高度的准备。研究表明,绩效奖励可能会损害被试的内在动机,削弱创造力(Fröber & Dreisbach, 2014)。尤其是学校教学过程中,偏爱使用绩效成绩考核制度来评判学生的学习情况和获得的奖励,这在一定程度上会损害学生对于学习的内在动机,导致他们过于关注学习所带来的外在奖励(Fröber & Dreisbach, 2016)。因此,学校教育以分数高低的形式给予学生绩效奖励的做法要谨慎考虑。
与预期假设和前人研究不同的是,非绩效奖励并没有提高反应性控制,它和绩效奖励一样促进了主动性控制。有研究表明,正面反馈会提高个体完成该项活动的积极性,甚至还可以抵御失败带来的消极影响(冯竹青,葛岩,2014)。该实验中的非绩效奖励阶段,在被试错误反应后也给予奖励,很有可能促进了被试完成任务的积极性,使其采取了避免错误的策略。非绩效奖励作为一种奖励线索,在任务到来之前能够提高被试的反应预期,将被试的注意力集中在目标任务上,使被试能够避免错误反应,激发了他们努力完成任务的动机,从而能够提高主动性控制。而Fröber和Dreisbach (2016)认为,非绩效奖励提高了反应性控制或降低了主动性控制,扮演着积极情绪的作用而非动机作用。我们认为导致结果有差异的原因与实验设计有关:首先,奖励与认知控制任务的关联方式不同。Fröber采用的是线索相关奖励(MID),通过线索提示能否获得奖励;本研究采用的目标相关奖励(SRA),将刺激直接与奖励相关联(Kostandyan et al., 2020),通过对刺激本身进行加工来发挥奖励的提升作用(王宴庆,陈安涛等,2019)。其次,实验材料不同。Fröber的研究通过情绪图片操纵奖励线索,实验中既包含奖励的动机作用也体现了情绪作用;而我们的研究是单纯的金币奖励实验,将动机因素分离出来单独考察。后续实验可以结合ERP和FMRI技术,采用不同的刺激呈现材料、实验范式、奖励与任务关联方式,进一步验证非绩效奖励对认知控制权衡的作用。
绩效奖励和非绩效奖励在日常生活中扮演着不同的角色。因此,采取哪种奖励制度,取决于它所发挥的最大效用以及适用性。总之,绩效奖励和非绩效奖励作为一种动机因素,都能提高主动性控制,使得被试以积极主动的方式来完成任务,投入了更多的认知努力,在认知活动中起着重要作用。
5. 结论
奖励能够优化认知控制表现。与任务相关的绩效奖励分配了更多的认知资源更新和维持目标信息,提前对认知冲突做出反应准备,更好地抑制冲突。与任务无关的非绩效奖励使被试采取了避免错误的策略,将注意力集中在目标刺激上提高被试的反应预期,激发了完成任务的积极性,从而促进认知任务的表现。因此,绩效奖励和非绩效奖励都能调节认知控制权衡,提高主动性控制。