1. 问题提出
几何推理是通过观察给定的几何图形的各种特征,并根据图形的定义、性质、判定等条件推测出结论的过程。几何推理能力则是个体在进行几何推理过程中表现出来的个性心理特征。初中阶段是学生推理能力发展的关键时期,提升几何推理能力的前提是细致评估初中生几何推理能力的微观认知结构。已有相关研究探索了中学生几何思维水平现状 [1] [2] [3],并与几何推理能力进行相关比较 [4],但研究均是基于经典测量理论与方法,编制的测验项目依据项目统计特性,通过学生答对的题目数量判断其是否掌握该水平或能力,对学生内在知识结构的关注不够,因此,已有的几何推理能力测验的内容效度还有待提升 [5]。
认知诊断评价(cognitive diagnostic assessment, CDA)能够解决通过经典测评无法测量的潜在能力问题,它强调个体宏观能力水平评估与微观心理加工过程并重,通过构建认知模型,对个体认知发展特征做细致诊断。近年来,已有研究者利用CDA理论构建了中学生数学问题解决能力的认知模型 [6] [7] [8] [9] [10],编制了适合不同认知属性结构,且区分度和难度较好的试题,而初中生几何推理能力认知诊断测验编制的研究仍显不足。本研究运用认知诊断的理论与技术,开发初中生几何推理能力的认知诊断测验,帮助教师识别学生几何推理能力的认知优势与劣势,为提高初中几何推理能力的教学效率及干预研究提供参考。
2. 研究方法
2.1. 对象与工具
从某市普通中学七、八、九年级中分别随机选取4个班级,班主任将测验通过线上发放到学生家长,学生需在测验发放当天作答,家长全程监督,确保学生在无电子设备等情况下认真作答,并在25分钟内提交作答结果。共回收653份数据,依据规律作答、作答时长少于5分钟等条件剔除无效数据,获得有效数据619份,测验有效率95%。测验数据的处理全部在R语言平台进行。
2.2. 方案
在证据中心设计(Evidence-Centered Design, ECD)的指导下编制测验,它要求精心设计项目,关注对认知结构和加工技能的评价,为合适的评估目的提供尽可能有效而完整的证据 [11],具体步骤如下:1) 描述评估目的,研究旨在为精确诊断初中生几何推理能力的结构特征,探究其能力背后的内部心理加工过程设计结构效度较高的诊断性工具;2) 选择潜在技能空间,研究详细分析初中数学核心素养框架、数学教材和课程标准,并查阅相关文献,提取初中生几何推理能力的关键认知属性,确定层级关系;3) 开发评估项目,研究基于几何推理能力认知模型,即考生解决题目的认知加工模型,也是认知诊断测验编制的测验Q矩阵,编制初中生几何推理能力测验;4) 依据模型拟合统计量选择合适的认知诊断模型,以实现测验项目的参数估计;5) 选择估计与计算方法精确快速的R语言平台进行测验质量分析;6) 报告项目质量评价结果。
3. 研究过程
3.1. 初中数学核心素养框架分析
喻平通过数学学科本质角度的考察,数学教育价值维度的分析,大样本问卷的因素分析和不同聚类标准的分析,得到了初中数学核心素养的两种结构 [12],董伟林和喻平又依据初中生的年龄特点与认知水平,参考高中数学核心素养水平划分框架,对初中数学核心素养的各个表现水平进行了划分 [13]。
“推理能力”在初中数学核心素养两种结构中均占据了重要位置。表1显示了初中数学核心素养“推理能力”各层次的表现水平,初中生推理能力处于低层次水平时,只了解数学知识的基本概念,或将各知识点之间做简单联系从而解决简单的数学推理问题;随着推理能力的逐渐提升,初中生不仅能够解决复杂问题,还可以提出问题,此时他们能够建立自己的知识体系,思维能力逐渐变得有论据、有条理且合乎逻辑。
![](Images/Table_Tmp.jpg)
Table 1. Level analysis of “reasoning ability” at all levels in the framework of junior high school mathematics core literacy
表1. 初中数学核心素养框架中“推理能力”各层次水平分析
3.2. 初中数学教材分析
研究拟选用《义务教育教科书·数学》(2014版,以下简称教材)作为属性提取的主要依据。初中三个年级的教材共30章,其中有12章属于“几何图形”的内容,占教材总内容的40%,教材中“图形与几何”的内容均反应了表2中“推理能力”的层级表现水平,教材内容呈现出螺旋式上升,相同或相近的题目或例题在不同模块中出现,不仅巩固了该章节基础知识的理解,还加强了前后知识间的纵向联系和对问题本质的理解。七年级上册的教材中只有第四章内容是几何图形初步,只要求学生掌握平面和立体几何,点线面体,直线、射线、线段以及角、余角、补角的概念与性质,其中大部分是小学阶段的学习过程中接触过的基本图形,刚进入初中年级段学习的学生数学推理能力还处于起步阶段,几何推理能力尚不成熟,带有直观、感性的特点,其目标就是要掌握直观推理能力。
七年级下册与八年级上册的教材中开始出现较简单的推理问题,各章节知识点后的例题均只需要学生具备掌握该节知识点和理解题目中已知条件的能力即可解答,这需学生理解文字语言,如理解平行线与相交线的性质定理,能够在图形上区分两条直线是否相交或平行,并且要能够用数学符号“//”表达两直线平行,甚至在九年级教材中有关几何图形的学习中,要求学生通过数学语言来理解各种图形的性质及判定定理,并通过其定理解决简单的推理问题;同时要求学生能够在推理过程中运用“≌(全等)、∽(相似)、⊥(垂直)”等数学符号表达推理的结论;学生还需要掌握识别各种图形转换,如能够准确识别图形的三视图、画出图形逆(顺)时针旋转N˚后的图形等推理能力。由此,可知学生在几何推理的过程中需要具备图形表达推理能力、文字表达推理能力和符号表达推理能力。
在知识点与例题学习完成后,八年级教材课后习题的题目中,绝大部分题目不仅需要学生掌握图形基本性质与判定定理,还需将几何直观推理能力、图形表达推理能力、文字表达推理能力和符号表达推理能力等四项推理能力与题中已知条件结合思考,从而推出其隐含条件,进而解决问题。这表明学生在具备以上四种能力后,倾向于抽象问题的解决,具备描述分析推理能力。
九年级学生开始接触圆、旋转、视图等几何的相关知识,例题和课后习题的题目线索也变得较为复杂,需要在包含多种图形的情况下解决几何问题,解决问题的内容线索不只是一个图形的性质,要求学生要能在不同条件、多种图形中转换知识点,建构知识框架,推理出隐含条件来解决实际几何问题,此时学生应当具备结构关联推理能力。
3.3. 关键认知属性的名称、定义和层级关系
认知属性是指个体作答几何推理能力题目时所运用的认知加工技能与策略。基于初中数学核心素养框架、教材等分析提取了诊断几何推理能力的6个关键认知属性,属性名称、定义如表2。图1为6个关键认知属性的层级关系图,其中属性A1是属性A2、A3和A4的先决条件,但A2、A3、A4三个属性同是属性A5的先决条件,即只有同时掌握了A2、A3、A4才能掌握A5。
![](Images/Table_Tmp.jpg)
Table 2. Names and definitions of key cognitive attributes for junior high school students’ geometric reasoning skills
表2. 初中生几何推理能力关键认知属性名称和定义
![](//html.hanspub.org/file/63-2393720x7_hanspub.png?20220602092547968)
Figure 1. Hierarchical relationships of cognitive attributes
图1. 初中生几何推理能力的认知属性层级关系
3.4. 项目编制
研究以2016年~2020年北京市中考试题和7~9年级数学教材等相关材料为参考,以表3的Q矩阵为测验蓝图,Q矩阵式是一个K行A列的0~1矩阵,“1”表示项目K考察了属性A,“0”表示项目K没有考察属性A。本着每个典型项目考核模式至少有1道题目考察,每个属性至少考察3次,且测验作答时长不超过25分钟的原则,初步编制了包含15个项目的初中生几何推理能力测验。首先邀请3名教研员、3名一线教师和5名测量学专家对测验内容进行讨论;然后随机抽取七、八、九年级各3名初步编制的几何推理能力测验,并就学生在作答过程中的解题思路和遇到的困难进行访谈;最后根据专家对题目与属性契合度的评价反馈、学生口语报告分析情况反复修改项目,初步确定了初中生几何推理能力测验,共15道题目。
![](Images/Table_Tmp.jpg)
Table 3. Junior high school students geometric reasoning ability test Q matrix
表3. 初中生几何推理能力测验Q矩阵
4. 研究结果
4.1. 认知诊断模型拟合检验
研究选取DINA、RRUM、GDINA和GDM四种竞争模型进行模型-资料拟合,如表4四种模型在数据上均没有达到p < 0.05显著水平,表明三种模型与数据均有较好的拟合,且各个模型与数据的拟合性各有优劣(统计指标值越小表明模型数据越拟合),已有研究认为BIC克服了AIC的一些缺点,将样本量N考虑在内,对复杂模型的惩罚利用样本量进行加权,所以其对模型的鉴别更有说服力 [14],因此决定选取DINA作为数据分析的模型。
![](Images/Table_Tmp.jpg)
Table 4. Relative fitted statistics for four cognitive diagnostic model
表4. 四种认知诊断模型的相对拟合统计量
4.2. 测验质量分析
采用mirt程序包进行项目难度、区分度参数的估计。区分度取值范围一般为[0, +3],其值越大,表示项目对不同考生能力水平的鉴别力越强;难度取值范围一般为[−3, +3],其值越大表示项目越难。结果如表5所示,测验项目区分度取值范围为0.326~2.330,均值为1.128,标准差为0.654,有超过60%的项目区分度接近或超过1,表明整体区分度达到了中等偏高水平;难度取值范围为−2.871~2.427,均值为0.081,标准差为1.300,测验项目以中等难度(难度值在−0.5~0.7之间)的项目为主,只有少量较难(K13、K14)或较容易(K1、K2)的项目,表明测验难度整体适中。
![](Images/Table_Tmp.jpg)
Table 5. An estimate of the difficulty and sensitivity of the quiz item
表5. 测验项目难度和区分度的估计结果
4.3. 测验信度分析
测验的克隆巴赫α系数为0.72,分半信度为0.71,表明测验内部一致性信度较好。
认知诊断评价中采用分类一致性和分类准确性作为评估属性分类信度的指标,其中分类一致性可较好的估计测验的重测一致性,分类准确性可较好的估计测验的判准率 [15]。结果如表6所示,模式分类一致性和分类准确性分别为0.70和0.67,六个关键认知属性的分类准确性和分类一致性的估计结果均在0.86~0.97之间,均值都在0.9以上,表明研究编制的初中生几何推理能力的认知诊断测验信度较高。
![](Images/Table_Tmp.jpg)
Table 6. Pattern (attribute) classification accuracy and consistency estimates
表6. 模式(属性)分类准确性与一致性估计结果
4.4. 测验效度分析
以能力属性为自变量,项目难度为因变量建立题目难度对认知属性的多元线性回归,考察认知属性对题目难度的解释力,结果显示R2为0.61,即认知属性能够解释题目难度的60%以上,研究定义的初中生几何推理能力的关键认知属性完备。
另一种效度的验证方法是用属性掌握概率预测原始总分变异。在CDM包中估计出个体在测验中的各属性掌握概率,然后用属性掌握概率对测验原始总分进行回归分析,决定系数R2为0.77,即测验的属性掌握概率能够解释测验总分77%的变异,表明研究定义的初中生几何推理能力的关键认知属性层级关系合理。
5. 小结
研究编制的“初中生几何推理能力认知诊断测验”各项信效度指标均达到了认知诊断理论和心理计量学的标准,能够为更深入研究初中生几何推理能力的发展提升提供较为稳定且可靠的信息。
基金项目
中国教育发展战略学会教育考试专项课题“内蒙古自治区普通高中学业水平考试自适应标准化题库建设研究”;内蒙古教育科学研究“十三五”规划项目“内蒙古自治区中小学生数学学业质量测评现状调查与实施策略研究”(2018JGH003);内蒙古师范大学研究生科研项目“初中生几何推理能力的认知诊断研究”(CXJJS20013)。