基于粗糙集对高等数学课程成绩的影响因素分析
Influence Factors of Higher Mathematics Course Grades Based on Rough Set Theory
DOI: 10.12677/PM.2021.1112232, PDF, HTML, XML, 下载: 397  浏览: 544  科研立项经费支持
作者: 刘巧云:青海民族大学数学与统计学院,青海 西宁
关键词: 粗糙集上下近似影响因素支持度重要性Rough Set Upper and Lower Approximation Influence Factors Support Degree Significance
摘要: 针对普遍认为的高等数学难的情况,采集了不同专业120名学生学习高数的情况与高等数学的综合成绩,利用粗糙集理论中上下近似的相关理论对采集的数据进行分析,得到数据之间的依赖程度,最终得到高等数学是否能通过的主要影响因素与得高分的主要影响因素。
Abstract: With the view that higher mathematics is difficult, 120 students’ situation from different majors to study high mathematics and the grades of higher mathematics are collected. By using the related theory of upper and lower approximation in rough set theory, the degree of dependence between the data is obtained, and the main influencing factors of whether higher mathematics can pass or not and the main influencing factors of high scores are finally obtained.
文章引用:刘巧云. 基于粗糙集对高等数学课程成绩的影响因素分析[J]. 理论数学, 2021, 11(12): 2087-2091. https://doi.org/10.12677/PM.2021.1112232

1. 研究背景

粗糙集理论是一种处理信息的方法,可以从先验信息中发现规律和一些潜在的知识。学习成绩的影响因素具有不确定的特点,范娟 [1] 利用粗糙集理论研究了数据结构这门课的五个因素对学习成绩的影响,高丽红 [2] 基于粗糙集理论对100个学生的学习成绩进行了影响因素分析。在这些研究的基础上,本文针对高等数学的成绩进行了因素分析。

《高等数学》是高等院校理工科专业的专业基础课、必修课。这门课的学习情况关系到后续专业课程的学习。自参加工作以来,一直在从事高等数学课程的教学工作,在期末考试结束后,考试结果不尽人意。从这个事实出发,选择在高等数学学习过程中对成绩有影响的8个因素作为对象,随机收集了本校不同专业120名学生的情况与成绩并进行一系列的分析。本文的安排如下:第1部分简要阐述粗糙集理论中的相关概念;第2部分对采集到的数据进行分析;第3部分给出主要结论。

2. 预备知识

这部分介绍与本文研究内容相关的基本概念.

定义1 [3] 设四元数组 S = ( U , A , V , F ) ,其中 U = { u 1 , u 2 , , u | U | } 是研究对象的非空有限集合,称为论域; A = { a 1 , a 2 , , a | U | } 是属性的非空集合; V = a A V a 表示A的值域,其中 a A ,Va是属性a的值域; f : U × A V 是一个映射,反映了每个研究对象每个属性的信息。知识表达系统也叫信息系统, S = ( U , A , V , F ) 可以简化为 S = ( U , A , V , F )

定义2 [3] 设 ( U , A , V , F ) 是一个信息系统,对于U中的一个划分U/a,两个对象 u , v U 在同一类中当且仅当 a ( u ) = a ( v )

定义3 [3] 对于给定的信息系统 S = ( U , A , V , F ) ,对于每个子集 X U 和等价关系 R ind ( K ) ,给出如下定义:

X的R上近似集: R _ X = { x U | [ x ] R X }

X的R下近似集: R ¯ X = { x U | [ x ] R X }

pos R ( X ) = R _ X 为X的正域, neg R ( X ) = U R ¯ X 为X的负域。 R ¯ X R _ X 是根据知识R判断U中一定属于X的元素组成的集合; R ¯ X 是根据知识R判断U中可能属于X的元素组成的集合;negR(X)是根据知识R判断U中一定不属于X的元素组成的集合。

定义4 [3] 当 A = C D C D = ,那么称集合C为条件属性集,集合D为决策属性集。属性 a X ,则a关于D的重要性被定义为: σ CD ( a ) = γ C ( D ) γ C { a } ( D ) ,其中 γ C ( D ) = | pos C ( D ) | | U |

3. 主要分析过程

3.1. 描述性分析

从采集到的120个样本数据看,得到下面的统计数据:认为自己数学基础好的有10个,占总样本的8.3%;认为数学基础中等水平的有84个,占总样本的70%;认为数学基础不好的有26个,占总样本的21.7%。为了描述更简洁,列表如下表1

Table 1. Sample data statistics table

表1. 样本数据统计表

表1可以看出,学生普遍课前不预习,导致在课堂上漫无目的的学习,学习效率不高;大部分都是社团协会成员或者班干部,本校学生参加活动的热情与积极性较高;很大一部分学生对数学都是有兴趣的;大部分学生只做了课上的例题和课后作业,没有做其他的题目。

从通过率来看,在这120个样本中,有21个综合测评成绩没有达到60,占调查人数的17.5%。从成绩的分布来看,16人成绩在85以上,占13.3%,48人成绩在75~85,占40%,35人成绩在60-75,占29.2%。成绩分布基本合理。

3.2. 影响考试通过的主要因素分析

利用传统粗糙集理论中的属性约简方法,将考试成绩作为决策属性,研究列出来的8个因素对最后的考试成绩的影响程度。

首先,需要对数据做预处理。将成绩分为5段:85~100分,75~85分,60~75分,50~59分,50以,并分别用1、2、3、4、5来进行表示,即决策属性D1 = {1, 2, 3, 4, 5}。将通过考试(成绩高于60)用1表示,没有通过考试(低于60)用0表示,即决策属性D2 ={0, 1}。将影响因素数学基础、课前预习、听课效率、课后复习、完成作业方式、班团干部或者协会成员、对数学的兴趣、是否做其他题目分别记为x1, x2, x3, x4, x5, x6, x7, x8,即条件属性C = { x1, x2, x3, x4, x5, x6, x7, x8}。取值情况列表如下表2

其次,计算等价类U/C (表示调查对象根据所有的条件属性进行划分等价类)、U/D1 (表示调查对象根据D1即考试是否通过这一决策属性进行划分等价类)、 U / ( C { x i } ) ( i = 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 ) (表示调查对象依次去掉某一条件属性后进行划分等价类),并计算出每一个条件属性的重要性。

Table 2. Value table

表2. 取值情况表

经计算,得 γ C ( D 1 ) = | pos C ( D 1 ) | | U | = 93 120 = 0.775 ,说明考试通不通过与这8个因素的依赖度为77.5%。

σ CD 1 ( x 1 ) = γ C ( D 1 ) γ C { x 1 } ( D 1 ) = 93 120 81 120 = 0.100

σ CD 1 ( x 2 ) = γ C ( D 1 ) γ C { x 2 } ( D 1 ) = 93 120 81 120 = 0.100

σ CD 1 ( x 3 ) = γ C ( D 1 ) γ C { x 3 } ( D 1 ) = 93 120 75 120 = 0.150

σ CD 1 ( x 4 ) = γ C ( D 1 ) γ C { x 4 } ( D 1 ) = 93 120 89 120 0.033

σ CD 1 ( x 5 ) = γ C ( D 1 ) γ C { x 5 } ( D 1 ) = 93 120 73 120 0.167

σ CD 1 ( x 6 ) = γ C ( D 1 ) γ C { x 6 } ( D 1 ) = 93 120 83 120 0.083

σ CD 1 ( x 7 ) = γ C ( D 1 ) γ C { x 7 } ( D 1 ) = 93 120 92 120 = 0.008

σ CD 1 ( x 8 ) = γ C ( D 1 ) γ C { x 8 } ( D 1 ) = 93 120 91 120 = 0.017

3.3. 影响考试成绩高低的因素分析

计算等价类U/D2 (将调查对象根据成绩高低进行划分等价类),并计算出8个因素整体与各个因素的重要性,得到下面的结果:

γ C ( D 2 ) = | pos C ( D 2 ) | | U | = 54 120 = 0.45

σ CD 2 ( x 1 ) = γ C ( D 2 ) γ C { x 1 } ( D 2 ) = 54 120 41 120 = 13 120 0.108

σ CD 2 ( x 2 ) = γ C ( D 2 ) γ C { x 2 } ( D 2 ) = 54 120 39 120 = 15 120 = 0.125

σ CD 2 ( x 3 ) = γ C ( D 2 ) γ C { x 3 } ( D 2 ) = 54 120 40 120 = 14 120 = 0.117

σ CD 2 ( x 4 ) = γ C ( D 2 ) γ C { x 4 } ( D 2 ) = 54 120 39 120 = 15 120 = 0.125

σ CD 2 ( x 5 ) = γ C ( D 2 ) γ C { x 5 } ( D 2 ) = 54 120 37 120 = 17 120 0.142

σ CD 2 ( x 6 ) = γ C ( D 2 ) γ C { x 6 } ( D 2 ) = 54 120 36 120 = 18 120 = 0.15

σ CD 2 ( x 7 ) = γ C ( D 2 ) γ C { x 7 } ( D 2 ) = 54 120 42 120 = 12 120 = 0.10

σ CD 2 ( x 8 ) = γ C ( D 2 ) γ C { x 8 } ( D 2 ) = 54 120 49 120 = 5 120 = 0.042

4. 结论

从2.1描述性分析来看,任课教师应该在激发学生的学习积极性方面更加努力,比如怎么让学生能在课前主动进行预习、在课后及时巩固复习等。目前我校正在采用线上线下结合的模式教学,希望学生能动起来,不管是高数还是其他课程期末考试成绩都能提高。

从2.3粗糙集理论分析结果看,上述8个因素对高等数学课程的影响程度为77.5%,总体对成绩影响较大。从单个因素看,这八个因素的重要性从数据看都比较小,可能我们问问题的方式不太准确,学生在回答的时候也有一定的隐瞒,不太符合真实情况。数学的基础对能否通过高数考试与考高分的影响不大。当学生干部等对能否通过考试影响不大,但是对考高分有一定的影响。课前预习与课后复习这两个因素对考试能否通过与考高分影响也较大。从这些样本分析得到做题多少对二者影响都不大,这个可能与期末考试题目偏简单有一定关系,在以后的出题过程中要注意这个问题。是否独立完成课后作业对二者影响都较大。

综合起来,以后在教学过程中要注意对学生学习积极性的培养,利用各种教学平台让学生课前预习、课后能复习并独立完成作业,在期末考试题目的难度方面,适当增加一些难度。

基金项目

青海民族大学校级项目(2021XJGH26)。

参考文献

[1] 范娟. 基于粗糙集理论对影响高校学生成绩因素的分析[J]. 电脑迷, 2017(5): 64-65.
[2] 高丽红. 基于粗糙集理论的大学生学习成绩影响因素分析[J]. 科学技术与工程, 2007, 7(4): 521-524.
[3] 张文修, 等, 编著. 粗糙集理论与方法[M]. 北京: 科学出版社, 2001.