从多重积分到Lasso——浅淡计算机科学与技术专业高等数学的教学
From Multiple Integral to Lasso—A Note on Teaching of Advanced Mathematics Specified to the Department of Computer Science
DOI: 10.12677/CES.2019.76138, PDF, HTML, XML, 下载: 665  浏览: 3,488 
作者: 付治国:东北师范大学信息科学与技术学院,吉林 长春
关键词: 高等数学多重积分LassoAdvanced Mathematics Multiple Integral Lasso
摘要: 随着机器学习、大数据分析等领域的迅速发展,在计算机科学与技术专业的学习中出现了大量新的数学问题。Lasso是机器学习、大数据分析领域正则化目标函数的重要工具。本文通过多重积分的教学,阐述了Lasso背后的数学原理。探讨了针对计算机科学与技术专业的高等数学教学内容改革。
Abstract: With the rapid development of machine learning, data science etc., many new problems about mathematics appeared in the class of computer science. Lasso is a key tool in solving optimization problems in machine learning, data science. In this paper, we will demonstrate Lasso in teaching of multiple integral and explore reforming the materials of advanced mathematics for the class of computer science.
文章引用:付治国. 从多重积分到Lasso——浅淡计算机科学与技术专业高等数学的教学[J]. 创新教育研究, 2019, 7(6): 812-817. https://doi.org/10.12677/CES.2019.76138

1. 引言

高等数学是理工科的基础课。它的主要内容包括微分学、积分学以及无穷级数等。这些内容几乎是所有数学领域的基础。并且广泛应用于各科学与工程领域。在大学课程中,高等数学是国内外高校理工科学生必修的基础课程之一。课程基本要求为使得学生通过对高等数学课程的学习,了解微积分的基础理论,并能灵活运用微积分的思想、方法与工具去解决学习或者实践中遇到的问题。

当前中国社会迅猛发展,国内教育水平也跟着迅速提高。高等数学的教学得到了充分发展,涌现出一批优秀的教师和教材。通过高等数学的教学,培养学生逻辑思维能力、抽象思维能力等基本素养的方面,近年来愈来愈受到重视 [1]。一些文科专业也开始开设该课程,作为学生综合素质培养的重要环节 [2]。高等数学的教学在计算机科学与技术专业尤为重要。该专业的几乎所有后续课程均需高等数学作为基础。今天的高等数学教学内容成型于几十年前,彼时计算机科学与技术的发展远不如今日之盛,相应的高等数学教学内容几乎没有以计算机科学与技术专业为背景的。这导致计算机科学与技术专业的学生在学习高等数学时兴趣不足,实践中教学效果比较差。为了提高高等数学的教学效果,已经有不少学者从教学手段、教学资源、教学方法等不同角度进行了积极的探索 [3] [4] [5] [6],本文拟从教学内容出发,研究如何针对计算机科学与技术专业提高高等数学的教学效果。

Lasso是机器学习、大数据分析等当前研究的热点领域中非常重要的正则化工具。本文接下来以高等数学中的三重积分球面坐标积分法的教学为例,通过应用多重积分,阐述Lasso背后的数学原理,加深对该内容的理解,从而提高教学效果。

2. Lasso

我们以线性回归模型来介绍Lasso。给定样本数据集 D = { x ι , y i } i = 1 n ,其中 x i = ( x i 1 , x i 2 , , x i d ) R d , y i R 。为了学习出能拟合样本数据的线性分类器,需要求下面的最优化问题

min w i = 1 n ( y i j = 1 d w j x i j ) 2 ,

这里 w = ( w 1 , w 2 , , w d ) ,非0的 w i 的个数称为特征的个数。为了保证提取特征的稀疏性,一个重要的方法是用 L 1 范数下的单位球作为正则项,求解下面的最优化问题

min w [ i = 1 n ( y i j = 1 d w j x i j ) 2 + α | w | ] .

其中 w = ( w 1 , w 2 , , w d ) ,这就是著名的Lasso正则化方法。但为什么利用Lasso可以保证特征向量 w = ( w 1 , w 2 , , w d ) 稀疏性,机器学习的文献均语焉不详。下面我们通过推广多重积分到高维情形,求得高维单位球的体积,并阐述其与Lasso背后数学原理的联系。

3. 多重积分与Lasso的数学原理

多重积分是高等数学中的重要教学内容,在现在的教学中,三重积分的极坐标换元法讲完后,这部分内容的教学就结束了。本文通过将多重积分推广到高维,来加深学生对这部分内容的掌握。在教学中,讲述完三重积分求单位球体积的极坐标方法后,诱导学生从换元公式

{ x = r cos φ y = r sin φ cos θ z = r sin φ sin θ ,

其中 0 r 1 , 0 θ 2 π , 0 φ π ,推导出求高维单位球

S n = { ( x 1 , x 2 , , x n ) | x 1 2 + x 2 2 + + x n 2 1 }

体积 V ( n ) 的换元公式

{ x 1 = r cos θ 1 x 2 = r sin θ 1 cos θ 2 x n 1 = r sin θ 1 sin θ n 1 cos θ n x n = r sin θ 1 sin θ n 1 sin θ n ,

其中 0 r 1 , 0 θ n 2 π , 0 θ i π , 1 i n 1 。在此处可以通过长度,面积,体积的高维推广,适当引导学生接触测度的概念。注意到此换元公式的Jacobi行列式为

| J ( n ) | = | x 1 r x 1 θ 1 x 1 θ n 1 x 1 r x 1 θ 1 x 1 θ n 1 x 1 r x 1 θ 1 x 1 θ n 1 | = r n 1 f ( θ 1 , θ 2 , , θ n 1 ) ,

也就是说这个Jacobi行列式关于变量r和变量集合 { θ 1 , θ 2 , , θ n 1 } 是变量可分离的。这个行列式的计算时线性代数的经典题目,通过这个行列式的计算,让学生意识到各个学科之间的联系。进而,通过定积分,二重积分,三重积分下长度,面积,体积的计算,引导学生推导出在直角坐标系下,单位球的体积可表示为

V ( n ) = x 1 = 1 x 1 = 1 x 2 = 1 x 1 2 x 2 = 1 x 1 2 x n = 1 x 1 2 x n 1 2 x n = 1 x 1 2 x n 1 2 d x n d x n 1 d x 1 .

经过上面的极坐标换元公式,单位球的体积可表示为

V ( n ) = 0 π d θ 1 0 π d θ 2 0 π d θ n 2 0 2 π f ( θ 1 , θ 2 , , θ n 1 ) d θ n 1 0 1 r n 1 d r .

我们记

A ( n ) = 0 π d θ 1 0 π d θ 2 0 π d θ n 2 0 2 π f ( θ 1 , θ 2 , , θ n 1 ) d θ n 1 ,

V ( n ) = 1 n A ( n ) .

为了计算 A ( n ) ,我们考虑下面的积分

I ( n ) = + + + e ( x 1 2 + x 2 2 + + x n 2 ) d x n d x n 1 d x 1

首先,由二重积分中的技巧,我们知道 + e x 2 d x = π 。又根据矩形区域上变量可分离函数的多重积分公式,我们知道 I ( n ) = i = 1 n ( + e x i 2 d x i ) ,从而可得 I ( n ) = π n 2 。另一方面,利用极坐标换元法将 I ( n ) 转换为

极坐标下的多重积分

{ x 1 = r cos θ 1 x 2 = r sin θ 1 cos θ 2 x n 1 = r sin θ 1 sin θ n 1 cos θ n x n = r sin θ 1 sin θ n 1 sin θ n ,

其中 0 r + , 0 θ n 2 π , 0 θ i π ,这里 1 θ i n 1 。从而我们有

I ( n ) = 0 π d θ 1 0 π d θ 2 0 π d θ n 2 0 2 π f ( θ 1 , θ 2 , , θ n 1 ) d θ n 1 0 + r n 1 d r = A ( n ) 0 + e r 2 r n 1 d r .

注意到经过换元 t = r 2 ,我们有

0 + e r 2 r n 1 d r = 1 2 0 + e t t n 2 1 d t = 1 2 Γ ( n 2 ) ,

这里 Γ ( n 2 ) 为Gamma函数,满足 Γ ( x ) = ( x 1 ) Γ ( x 1 ) , Γ ( 1 2 ) = π , Γ ( 1 ) = Γ ( 2 ) = 1

这样我们有 π n 2 = 1 2 Γ ( n 2 ) A ( n ) ,即 2 π n 2 Γ ( n 2 ) = A ( n ) 。从而

V ( n ) = 2 π n 2 n Γ ( n 2 ) ,

由于 Γ ( n 2 ) 以阶乘增长,故

lim n + 2 π n 2 n Γ ( n 2 ) = 0 .

这表明

lim n + V ( n ) = 0 .

也就是说随着n的增加,单位球的体积趋近于0。这时候我们来看高维正立方体

C n = { ( x 1 , x 2 , , x n ) | | x 1 | + | x 2 | + + | x n | 1 } .

它的体积为 2 n 2 。另一方面,单位球 S n 为正立方体 C n 的内接球。由前面的分析,单位球的体积随着维度

增加,体积趋近于0。这表明高维立方体 C n 的体积集中在内切球外面的部分。

由拉格朗日对偶定理,优化问题

min w [ i = 1 n ( y i j = 1 d w j x i j ) 2 + α | w | ]

等价于下面的带不等约束的优化问题

min w i = 1 n ( y i j = 1 d w j x i j ) 2 ,

| w | λ

其中 λ 为一个大于0的常数。令 h ( w 1 , w 2 , , w n ) = i = 1 n ( y i j = 1 d w j x i j ) 2 ,显然 h ( w 1 , w 2 , , w n ) 是一个高维空间的椭圆族。当对某个 λ 0 λ ,使得以 h ( w 1 , w 2 , , w n ) = i = 1 n ( y i j = 1 d w j x i j ) 2 为方程的椭圆与高维立方体

| w | λ 0 相切时,此时对应的 ( w 1 , w 2 , , w d ) 即为满足不等约束的最优值点。以 d = 2 为例,我们用下面的图来表示这一过程

由于高维立方体的体积集中在内接球外面的部分,故最优值点大概率落在该区域。该区域的特点是除了少数特征外,大部分特征都很小,接近于0。通过将接近于0的特征置0,我们就得到了稀疏的特征向量。这就是用Lasso来正则化目标函数可以使得特征向量具有稀疏性背后的数学原理。

4. 结语

本文结合在计算机科学与技术专业中十分重要的Lasso正则化技术,加强高等数学多重积分等内容的教学。这部分内容有具体的计算机科学的背景,又与高等数学,线性代数中的诸多内容交叉。在实践中取得了学生积极的反应。实践证明,通过将高等数学教学内容与学生所在学科的专业内容相结合,可以有效提高学生学习的积极性。

致谢

非常感谢审稿老师以及编辑部老师对本文提出的宝贵意见!

参考文献

[1] 张春红. 浅析高等数学的教与学[J]. 科协论坛(下半月), 2013(8): 191-192.
[2] 黄加增. 浅谈高等数学在不同专业的教学改革与现实[J]. 数学学习与研究, 2011(23): 2-3.
[3] 张玲, 陈永强, 张华. 新工科建设背景下高等数学多目标教学模式探索[J]. 教书育人(高教论坛), 2019(9): 110-112.
[4] 远巧针. 高等数学教学中情感教育实施策略探讨[J]. 才智, 2019(9): 145-146.
[5] 李涛. 新建地方本科院校高等数学教学质量的评价研究[J]. 中国农村教育, 2019(5): 23-25.
[6] 程国, 余兴民. 应用型本科院校高等数学教学质量影响因素与对策研究[J]. 现代计算机(专业版), 2015(15): 23-27.