1. 引言
在大数据时代,数据信息的感知和收集都变得越来越容易。如今以云计算为代表的计算技术的飞速发展使得数据的获取、存储、搜索、共享、分析,乃至可视化呈现都成为了热门研究课题。2020年4月,中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》 [1] ,首次把数据作为第五大生产要素,与其他传统要素并列。
统计是数据挖掘的核心部分,它涵盖了数据分析的整个过程。在《概率论与数理统计》的教学过程中会发现重课本知识的讲授,轻实际案例的应用这种现象依然普遍存在。这就导致学生无法灵活应用所学统计知识进行数据处理和分析,更不能将统计知识和本专业内容融合在一起。本文以协方差这一节为例,采取“CBL + PBL”教学模式,以粮食生产因素分析案例的解决为主线,介绍协方差等相关理论知识,通过主成分分析的算法,获取影响粮食生产的主要因素。
2. “CBL + PBL”教学模式
案例教学法(Case-Based Learning,简称CBL)最早来自美国哈佛大学,是指根据教师设计的教学案例,让学生提取案例中的有效信息,着力培养学生剖析和解决实际案例问题的能力 [2] 。但CBL教学模式还是以教师为中心,学生仍是“被动学习”。PBL (Problem-based)问题式学习的教学法以学生为中心,教师根据讲授的理论知识 [3] ,以问题为基准,让学生在教师的指导下自主研究讨论出结果并掌握教学内容。
为了突破单一教学模式的桎梏,目前国内外已有大量的教育学者尝试了“CBL + PBL”的教学模式。例如任静 [4] 的基于“CBL + PBL”和学习通平台的“信息资源管理”的研究,李宁 [5] 等对构建CBL-PBL模式在“植物病害流行学”教学改革中的探索与实践等。但是就目前的数学类课程的教学而言,这方面的研究和尝试还不是特别多。
“CBL + PBL”教学模式提出了案例引导,问题提出,深入讲解,步步递进等一系列的教学推进方式。学生通过查阅资料、自主探索、发现规律、得出结论等一系列的主动学习,更深层次地参与到课堂,理解所学内容。总之,“CBL”为“PBL”的实施设定了方向,“PBL”为“CBL”提供了问题的解决,实现了能力的提升。
3. 教学内容简介
本文选用教材是同济大学数学科学学院编写的《工程数学:概率统计简明教程》 [6] ,计划学时为2学时,内容主要包括:
1) 协方差和协方差矩阵等相关教学内容;
2) 二维和多维主成分分析原理;
3) 主成分分析在农业方面的应用。
4. 在“CBL + PBL”教学模式下的教学设计
“协方差”这节课描述了二维随机变量的数字特征,承上启下,为接下来二维随机变量的有关分析和数理统计奠定了基础。主成分分析这一数据处理方法的原理是将具有相关性的指标线性组合成一些无关的指标,减少数据的冗余。根据原指标矩阵的协方差矩阵的特征值和特征向量可以确定主成分的个数和系数。所以在讲解“协方差”这一节课时引入主成分分析方法的案例应用,将“CBL + PBL”教学模式具体融入到课堂当中,提高学生的知识迁移能力和数学建模能力。
4.1. 学情分析
授课学生为农业经济管理专业大一的新生,已经有了方差和《线性代数》中对称矩阵相关概念和性质的基础,并掌握了SPSS软件的一些基本操作。通过本节知识的讲解,将协方差和协方差矩阵等相关内容应用到数据分析处理当中,实现知识的迁移。同时,为接下来的其他专业课的学习奠定了理论基础。
4.2. 教学目标
4.2.1. 知识目标
1) 掌握协方差、相关系数和协方差矩阵的概念和性质;
2) 辨析协方差和协方差矩阵概念之间的区别;
3) 明确主成分分析原理,总结主成分分析的用途。
4.2.2. 能力目标
1) 提升从抽象到具体的数学思维能力。将引入的案例自觉转化为数据降维问题。对实际案例养成观察与分析的习惯,提高自学能力;
2) 培养总结、概括和应用能力。能根据理论知识设计推导解决案例问题的步骤并准确计算;
3) 加强SPSS、MATLAB等数学软件操作能力。
4.2.3. 价值目标
1) 学生经过观察与分析,感受探索的乐趣与成功的喜悦,体会数学的严谨与重要性,激发学生对数学的兴趣与热爱以及追根求源的创新精神;
2) 以山东粮食生产为案例,介绍我国粮食生产的瞩目成就,厚植爱国情怀,了解我国农情,让学生知农爱农。
4.3. 教学重难点
1) 教学重点:掌握协方差、相关系数和协方差矩阵的概念和性质。
2) 教学难点:
① 理解主成分分析原理;
② 将主成分分析原理的数据降维处理方法运用到实际案例当中。
4.4. 案例教学设计
将“CBL + PBL”教学模式融入到课程中需注意引入的案例问题既要与实际问题紧密相关,又要贴合学生专业背景。
4.4.1. 案例引入
以山东省粮食生产为研究案例,基于2007年~2020年的《山东统计年鉴》 [7] 的农业数据统计资料,分析影响粮食生产的因素。其中介绍袁隆平院士的主要贡献和中国粮食生产的辉煌历程。
在课下学生通过SPSS软件对查资料整理的数据进行标准化处理,在课上引导学生思考如果某些数据之间有较强的相关性,就可以把它们归纳成一类,从而实现数据的降维,这就是主成分分析的基本思路。在解决案例问题之前,先讲解协方差、协方差矩阵的基本理论知识。
4.4.2. 知识讲解
讲解基础理论知识时,要坚持以问题为导向,不断抛出疑问,学生通过课堂互动、小组思辨、团队协作等方式层层剖析教学目标的重难点,从而达成知识目标层面的标准。
1) 协方差、协方差矩阵基本理论知识
教师讲解协方差定义时需让学生观察到两个随机变量X与Y的协方差因为有量纲差异所以无法表示随机变量之间的线性相关性,为引导学生消除量纲差异从而引入相关系数这一概念来反应两个变量之间的空间分布走向。
教师提出协方差矩阵概念后,让学生注意到协方差矩阵是协方差的推广,引导学生多加注意协方差矩阵内部的元素,结合《线性代数》课程中对称矩阵这一节内容,通过小组活动等方式推出协方差矩阵的性质。
2) 主成分分析基本原理
学生学完了基本知识后,引入数据降维处理方法——主成分分析,并介绍其原理,让学生深入理解主成分分析的内涵。若直接讲解多维的主成分分析原理,学生接受起来有些困难,因此在教学中先引入二维数据降维的情形,方便学生理解。
① 二维数据的主成分分析原理
例:给出一组二维数据
(4, 4), (6, 6), (10, 10), (12, 11.8), (13, 13.1), (15, 15), (18, 18.1)
并在MATLAB中作图。
从图1可知,这组数据在直角坐标系中基本呈线性关系。调整坐标系(见图2)可以明显看出,新建立的坐标系中横轴就基本囊括了这组数据,因此就不需要记录这些数据的纵轴坐标了,从而达到了数据降维的目的。接下来的问题就是如何将旧坐标系转化为新坐标系。教师引导学生思考以下两个问题:
(1) 新坐标系的原点在哪里?
(2) 比起旧坐标系,新坐标系旋转了多少角度?
对于问题(1),将数据去中心化就可以把坐标原点放在数据中心。
对于问题(2),从图2可以看出新建立的坐标系的横轴基本包含所有数据,换句话说此时对数据做投影时最分散,要想找到这个时刻,需引入所学的方差——一个描述相对于期望分散程度的指标 [6] 。
教师在分析的过程中,先引导学生利用逆向思维将白数据
(协方差矩阵为单位矩阵)通过缩放变换
和旋转变换
得到原始数据
,即
。后根据协方差矩阵的性质得出缩放变换决定了方差的最大方向,旋转变换决定了方差的最大方向的角度这一结论。
Figure 2. Scatter plot of data after coordinate rotation
图2. 坐标旋转后的散点图
最后引导学生利用二维的主成分分析原理与MATLAB软件通过小组思辨得出下列结果:这组数据的协方差矩阵对应的特征值为
和
,很明显,
要远大于
,说明特征值
所对应的特征向量
决定了旋转方向,即原直角坐标系逆时针旋转45˚,这也验证了我们之前看图所得到的结论,形成知识闭环。
② 多维数据的主成分分析原理
继续采用类似的想法,推广到多维数据。设有p项指标
,每个指标有n个观测数值,将p项指标作线性变换
.
现在的目标就是寻找
的一组投影方向,得到一组新的
,其中
,使得这些主成分
可以代替
,从而进行了降维。类比二维数据降维的思想和累计贡献率大于85%这一条件限制,引导学生得出主成分分析可以转换成一个矩阵特征值分解问题 [8] ,即m是由特征值所表达的累计贡献率决定的,
是由特征值所对应的特征向量决定的。
4.4.3. 案例讲解
介绍完主成分分析的原理后,引导学习者讨论最开始的实际农业数据问题并得出相关结论。
由于之前已经对数据消除了量纲差异,接下来由教师引导利用SPSS软件做主成分分析。在这一部分的教学过程中,教师需详细解释做主成分分析的前提,主成分贡献率、累计贡献率的计算以及主成分系数,得出两个主成分后学生根据课前发布的相关论文进行小组讨论,小组代表概括发言,组间同学相互补充,教师负责解释总结。
案例讲解的过程中通过SPSS软件的针对性训练培养了学生软件操作能力,案例详解培养了学生数学建模思维能力,农业案例中的思政元素激发学生爱国热情,小组讨论培养了学生资料查阅能力和小组协作能力,组间同学相互补充培养了学生发散思维能力,从而达到能力培养目标和素质培养目标。
4.4.4. 考核方式
通过课前准备、理论教学、软件操作、解决问题、课后补充等过程,让学生体会到主成分分析在实际专业领域解决农业生产问题的过程,开阔视野,提升应用能力和综合素质。
本节课采取课前(30%)、课中(40%)和课后(30%)三种相结合的考核方式,给予可量化的评价方式。
课前主要考核学生的预习程度和利用SPSS软件处理数据的能力,如学生课前数据处理的完成程度,课前测验的准确率等;课中主要考核学生参与程度以及知识的掌握程度,如小组对抗时组内同学的协作能力和组间同学的思辨能力;课后主要考核学生知识迁移能力和创新意识,如课后查找的案例是否贴合所学内容,解决问题的方法是否新颖以及对整个系统问题是否合理设计等。
4.5. 教学反思
针对传统教学中枯燥呆板、教师讲的多,学生参与少,知识和应用相割裂等问题,本节课在“互联网+”和“四新”建设的背景下,采取的“CBL + PBL”的教学模式有课程案例个性化、问题抛出合理化、考核方式可量化等优点,教师机动空间强,学生参与程度高,课下发挥空间多,真正将知识的实用性融入到课堂当中。
5. 结束语
对于应用型院校来说,如何将抽象的数学知识更加贴合学生专业背景,增强知识的实用性是需要攻破的一个难题。“CBL + PBL”的教学模式通过案列引入、问题承接等方式让学生懂得知识的运用,开拓思辨能力,提升综合素质,更加符合应用型本科院校的培养目标。
基金项目
1) 山东省教育教学研究课题“新工科背景下基于创造性思维培养的大学数学课程教学改革研究”(2021JXY009)。
2) 校级教学研究与改革项目“CBL + PBL”教学模式在《概率论与数理统计》课程中的探索研究(22XJKTY16)。
NOTES
*通讯作者。