人口老龄化背景下老年人幸福感影响因素探析——基于改进GRA-二分类Logistic模型与RUSBoost算法
Exploring the Factors Influencing the Well-Being of the Elderly in the Context of Population Ageing —Based on Improved GRA-Disaggregated Logistic Model with RUSBoost Algorithm
DOI: 10.12677/ASS.2023.127547, PDF, HTML, XML, 下载: 153  浏览: 363  科研立项经费支持
作者: 黎梓轩, 李 妍, 李子轩:广东财经大学文化旅游与地理学院,广东 广州
关键词: GRA-Logistic二分类模型RUSBoost算法老年人幸福感GRA-Logistic Dichotomous Model RUSBoost Algorithm Elderly People Well-Being
摘要: 随着中国社会老龄化程度的不断加深,老年人口总量和比例逐年增加。老有所养,事关亿万百姓福祉,也是人口老龄化社会面临的一道必答题。本文选取CHARLS 2018年全国调查的数据,运用改进GRA-Logistic回归模型和RUSBoost算法探究老年人幸福感与健康行为、家庭关系、人际交往、工作概况、医疗养老服务之间的关系,并分析比较二者的优劣。结果表明,医疗养老服务对老年人幸福感影响程度最大,人际交往最小;性别、受教育程度和婚姻等因素与老年人幸福感有关。模型分析比较显示,改进GRA-Logistic二分类模型准确度比一般Logistic回归模型高,GRA-Logistic二分类模型的分类情况比RUSBoost算法好。基于此,本文提出相关建议,为培育和健全养老制度、提高老年人幸福感提供更好的决策依据。
Abstract: With the deepening of aging in Chinese society, the total number and proportion of elderly people are increasing year by year. The well-being of hundreds of millions of people is at stake, and it is also a necessary answer to the question of population ageing society. This paper uses data from the CHARLS 2018 national survey to investigate the relationship between older people’s well- being and health behaviours, family relationships, interpersonal interactions, work profiles and medical and elderly care services using an improved GRA-Logistic regression model and the RUSBoost algorithm, and to analyze and compare the advantages and disadvantages of the two. The results show that medical and elderly care services have the greatest impact on older people’s well-being and interpersonal interactions the least; factors such as gender, education level and marriage are related to older people’s well-being. The model analysis comparison shows that the improved GRA-Logistic dichotomous classification model is more accurate than the general logistic regression model, and the GRA-Logistic dichotomous classification model has a better classification than the RUSBoost algorithm. Based on this, this paper puts forward relevant suggestions to provide a better basis for decision making to foster and improve the elderly system and enhance the well-being of the elderly.
文章引用:黎梓轩, 李妍, 李子轩. 人口老龄化背景下老年人幸福感影响因素探析——基于改进GRA-二分类Logistic模型与RUSBoost算法[J]. 社会科学前沿, 2023, 12(7): 4014-4023. https://doi.org/10.12677/ASS.2023.127547

1. 引言

随着中国社会老龄化程度的不断加深,老年人口总量和比例逐年增加。根据第七次全国人口普查公告数据显示,我国60岁及以上人口已达到2.64亿人,占我国全部人口的18.7%。老年人的幸福感问题,事关亿万百姓福祉,也是人口老龄化社会面临的一道必答题。

目前,学界对老年人幸福感研究以问卷方式居多,但幸福感作为一种心理感受,对其研究的过程容易受到外部因素的干扰。George (2015)认为主观幸福感核心的要素是主观上的持续性,而生活满意度因为属于较稳定的测量值,所以可以用于反映老年人群主观幸福感 [1] ;国内学者段建华(1996)经过考察分析出健康、经历、抑郁或幽默感、满意度和生活兴趣、控制情绪和行为,放松或紧张的六个因素会直接反映出居民幸福感高低 [2] 。而在对老年人幸福感影响因素的研究上则有从居住安排 [3] 、代际关系和人际关系 [4] 、养老保险 [5] 等角度进行分析。

学界对老年人幸福感衡量与影响因素探讨已经较为全面,但存在较为趋同的现象,且对方法层面的研究不足,较多使用传统统计模型分析。而本文与其他论文不同之处在于:第一,本文优化了传统Logistic模型 [6] 的速度,进行特征筛选,减少维数灾难出现的可能,更容易挖掘数据本身带有的规律,充分理解数据。第二,绝大多数幸福感的研究都采用量化研究方法,而关于质性的分析稍显不足。第三,当下研究多数以经典的传统方法为主,但传统方法对数据分布有较为严格的假设前提,但样本分布不均匀的现象更常发生,这对于数据最终预测效果有一定的影响和限制,使得数据准确度大大降低,因此引进RUSBoost算法 [7] [8] 进行分析。

综上所述,本文建立改进GRA-二分类Logistic回归模型和RUSBoost算法,选取CHARLS 2018年全国调查的数据对模型优劣进行实例验证,通过控制性别、年龄、受教育情况、婚姻情况等与老年人主观幸福感相关的人口统计学特征,探究老年人主观幸福感与健康行为、家庭关系、人际交往、工作概况、医疗养老服务之间的关系,并分析比较二者的优劣,为培育和健全养老制度、提高老年人幸福感提供更好的决策依据。

2. 模型选取与建立

由于幸福感是一个主观动态变量,调研中受访者对自身幸福感程度评估能力较弱,因此本文将幸福感划分为幸福与不幸福,并选用二分类Logistic模型进行探究。Logistic模型常用于分析变量的影响因素,同时经过特征选择的Logistic模型更易挖掘数据规律,因此结合灰色关联分析法对该模型进行改进 [9] 。由于不同地区经济发展及其带动效应存在差异,并且问卷收集受到主客观因素影响,因此部分地区样本数据存在比例失调的现象。而RUSBoost模型在欠采样的基础上结合集成算法,可有效解决样本不平衡问题,因此本文建立改进GRA-二分类Logistic模型与RUSBoost模型,对比二者的应用效果,从而获取更合理的结果。

2.1. 改进GRA-二分类Logistic模型

2.1.1. 改进的灰色关联分析法

灰色关联分析是一种对系统发展变化态势进行定量描述和比较的方法,基本思想是通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧密 [10] 。计算方法与步骤如下:

1) 构建数据矩阵

设因变量序列 x 0 = { x 0 ( 1 ) , x 0 ( 2 ) , , x 0 ( n ) } ,自变量序列 x 1 = { x 1 ( 1 ) , x 1 ( 2 ) , , x 1 ( n ) } x 2 = { x 2 ( 1 ) , x 2 ( 2 ) , , x 2 ( n ) } ,…, x m = { x m ( 1 ) , x m ( 2 ) , , x m ( n ) } ,得出矩阵如下:

[ x 0 ( 1 ) x 0 ( n ) x m ( 1 ) x m ( n ) ] (1)

2) 数据矩阵正向化

将所有指标类型统一转化为极大型指标,转化公式如下:

{ x k = 1 x k y k = { 1 a y k M , y k < a 1 , a y k b , M = max { a min { y k } , max { y k } b } 1 y k b M , y k > b z k = 1 | z k z b e s t | M , M = | z k z b e s t | (2)

3) 对变量序列进行无量纲化处理

x 0 ( k ) = x 0 ( k ) x 0 ( 1 ) (3)

x i ( k ) = x i ( k ) x i ( 1 ) (4)

式中: k = 1 , 2 , , n ; i = 1 , 2 , , m

4) 计算绝对差值

a = min k | x 0 ( k ) x i ( k ) | , (5)

b = max k | x 0 ( k ) x i ( k ) | , (6)

式中: k = 1 , 2 , , n ; i = 1 , 2 , , m

5) 计算关联系数

δ i ( k ) = min i min k Δ i ( k ) + ρ max i max k Δ i ( k ) Δ i ( k ) + ρ max i max k Δ i ( k ) , (7)

式中: ρ 为分辨系数,取值范围为 [ 0 , 1 ] ρ 的取值随着关联度的改变而改变, ρ 越小越容易增大关联系数间差异,一般情况下,可以取0.5; k = 1 , 2 , , n ; i = 1 , 2 , , m

6) 计算关联度

为了提高模型准确度,减少均值计算关联度所带来的误差,引入变异系数对关联系数进行加权处理:

V i ( k ) = σ i ( k ) x i ¯ ( k ) (8)

ω i ( k ) = V i ( k ) i = 1 m V i ( k ) (9)

r i = k = 1 n ω i ( k ) δ i ( k ) (10)

式中: V i > 是第i项因素的变异系数; σ i 是第i项因素的标准差; ω i 为权重; r i 为加权后得到的关联度; k = 1 , 2 , , n ; i = 1 , 2 , , m

7) 计算关联序列

将加权后的关联度进行排序得到关联序列。

2.1.2. 二分类Logistic回归模型

不同影响因素对因变量影响不同,现为了研究对因变量提升最为显著的影响因素,笔者选择效用最大方案。

对于任何长者个体n,其生活满意度中选项i与选项j两种答案,对应的效用函数如下:

U i n = V i n + ε i n (11)

U j n = V j n + ε j n (12)

式中: U i n U j n 为长者n在选项i和选项j中的影响效用; V i n V j n 为长者n在影响因素i和选项j的效用函数中的固定项; ε i n ε j n 为长者n在影响因素i和选项j的效用函数中的随机项 [11] [12] 。

效用函数确定项与对应影响因素一般采用线性方式表示:

V i n = θ T X i n = k = 1 k θ k X i n k (13)

式中: θ T 为参数向量; X i n 为特征向量;k为特征向量的个数; θ k 为第k个变量对应的回归系数; X i n k 为长者n选择生活满意度选项i的第k个特征变量。

而当长者n选择i会在 U i n > U j n 时发生即:

P n ( i | Ω ) = Pr [ U i n > U j n , i Ω ] (14)

式中: Ω 为选项集合。

求解上述不等式求得在给定特征向量个体选择i的概率为:

P Ω ( i ) = 1 1 + e θ 0 + k = 1 k θ k X i k (15)

式中: θ 0 表示回归截距。

2.1.3. 改进GRA-二分类Logistic模型

本文结合上述模型,提出了改进GRA-二分类Logistic模型,首先通过变异系数对灰色关联分析法进行改进;然后采用改进的灰色关联方法对选取的因素进行再次特征选择,得出主要的影响因素;最后对计算结果进行分析,结合灰色关联分析法与二分类Logistic模型二者函数,可进行概率的推导:

U i = V i + ε i = α i + m = 1 M β i m x i m + ε i (16)

U j = V j + ε j = α j + m = 1 M β j m x j m + ε j (17)

式中: U i 是选项i的效用; U j 是选项j的效用; V i V j 为在影响因素i和选项j的效用函数中的固定项; ε i ε j 为影响因素i和选项j的效用函数中的随机项。 α i α j 为常数项; β i m β j m 为待定系数; x m 为分自变量。

分析任意一个选项发生的概率P与影响因素间的关系,其模型表达式为:

ln P ( i ) P ( I ) = α i + m = 1 M β i m x m (18)

以其中一个选项作为参照类别,可以得到另一个选项的概率, x m 为长者生活满意度影响因素,选择概率计算如下:

P I = 1 1 + exp ( α j + m = 1 M β j m x j m ) (19)

P i = exp ( α i + m = 1 M β i m x m ) 1 + exp ( α j + m = 1 M β j m x m ) (20)

式中: P i 为选择非参考项的的概率, P I 为选择参考项的概率。

2.2. RUSBoost算法

RUSBoost算法是在是在集成算法Boosting的基础上,结合了“欠采样”法(从样本量较大的类中去除部分样本,使得类别分布更均衡)的混合算法,可有效解决样本不平衡问题 [13] 。具体算法过程如表1所示。

3. 实例验证

考虑到问题调查的背景与模型的适用条件,本文数据选取自CHARLS 2018年全国调查的数据,收集了有较高的客观、合理性的中国中老年人家庭及个人的数据,共纳入15,718人。

Table 1. Flow chart of RUSBoost algorithm

表1. RUSBoost算法流程表

3.1. 数据变量选取

3.1.1. 因变量

本文因变量为长者生活满意度。生活满意度是一个较稳定的测量值,可以反映居民幸福水平,本文借助CHARLS 2018中的“总体生活满意度”反映长者幸福感。原始问卷中从1到5分别代表“极其满意”到“一点都不满意”,本文将其进行加总为二分变量,从1~3定义为满意,取值为0;4~5定义为不满意,取值为1。

3.1.2. 自变量

1) 健康行为

本文考察的健康行为包括以下三个指标:自评健康程度、是否有精神问题以及每周进行的体力运动天数。自评健康程度从好到很不好分为五个程度,分别赋值为1到5;是否有精神疾病,如果是则赋值为1,否则为2;体力活动包括激烈活动、中等体力活动以及轻度体力活动,分别作为三个连续变量从0到7取值。

2) 家庭关系

本文考察家庭关系主要侧重于代际支持,包括与子女联系次数以及相处月份。和子女联系频率包括差不多每天、每周2-3次、每周一次、每半个月一次、每月一次、每三个月一次、半年一次、每年一次、几乎从来没有、其他等程度,赋值为1~10;与孩子相处月份为连续变量从0到12取值。

3) 人际交往

通过统计过去一个月是否串门、打麻将、向邻居提供帮助、跳舞、参加社团组织活动、参加志愿者活动或慈善活动、照顾残疾人或病人、参加培训课程、炒股、上网、其他社交活动以及没有参加以上活动等12种情况评估老年人社交状况,分别赋值为1到12,形成社交活动指数。

4) 工作概况

本文考察的工作概况主要包括每周工作时长和对工作的满意度,每周工作时长是连续变量,取值为0到7;对工作的满意度从没有但满意到一点也不满意6种程度,分别赋值为0到6。

5) 医疗养老服务

本文考察的医疗养老服务包括受访者享受的居家和养老服务情况、养老保险的参与情况及其对本地医疗服务的满意程度。养老服务类型包括养老服务中心等情况,若以上服务均不享有,则赋值为0,否则赋值为1;养老保险类型包括城乡居民养老保险、新型农村养老保险、城镇居民养老保险,分别赋值为1到3,如以上类型均为参与则赋值为0;对本地医疗服务满意度从非常满意到一点也不满意5种程度,赋值为1到5。

3.1.3. 控制变量

控制变量是与老年人主观幸福感相关的人口统计学特征,包括性别、年龄、受教育情况、婚姻情况。如果受访者为男性,则赋值为1,否则为2;年龄则作为连续变量取值;受教育情况在问卷中涉及到11种情况,分别赋值为1到11;婚姻情况则对问卷中的6种可能性分别赋值为1到6。

3.2. 模型求解

为了确保模型的泛化能力,本文对选取的北大追踪指标数据采用5折交叉验证法,先将数据集划分为5个大小相似的互斥子集,同时尽可能保持数据分布的一致性;然后,将4个子集的并集作为训练集,剩下的作为测试集,进行5次训练后,返回结果的均值,从而建立出最适合老者幸福感数据的逻辑回归分类模型和RUSBoost集成分类学习器,并对数据进行分析。

4. 结果分析

笔者将数据导入建立的模型求解后,得到关于改进GRA-二分类Logistic模型与RUSBoost算法应用效果的相关结论,以及在改进GRA-二分类Logistic模型下的幸福感的深入分析结果。

4.1. 两种模型结果分析比较

为对比两类模型的效果,引入机器学习中用于评估模型质量的ROC曲线,具体定义如下:ROC曲线的意思是根据一系列的分类阈值,以真正类率为纵坐标,假正类率为横指标绘制的曲线。而AUC是指ROC曲线与下方的坐标轴组成的面积,范围在[0, 1]之间,越接近1代表模型的分类效果越好,大于0.5以上的指标才具有应用价值 [14] [15] 。笔者通过MATLAB对2018年全国调查的数据运行改进GRA-二分类Logistic模型和RUSBoost算法,得到的AUC值如表2所示。如表2所示,尽管改进GRA-二分类Logistic模型效果分类效果更佳,但是RUSBoost算法的AUC大小比改进GRA-二分类Logistic模型更大,由于本次的数据因变量的生活满意度样本不平衡,因此反应RUSBoost算法能有效地针对样本不平衡问题。

Table 2. Comparison of the effects of the improved GRA-disaggregated logistic model and the RUSBoost algorithm model

表2. 改进GRA-二分类Logistic模型与RUSBoost算法模型效果对比表

4.2. 两种模型下主观幸福感分析

由于改进GRA-二分类Logistic模型在本问题上的准确度比RUSBoost算法高,因此本文关于幸福感的深入分析将以改进GRA-二分类Logistic模型为例。

4.2.1. 改进GRA关联度

笔者通过改进GRA方法后,得到的自变量影响幸福感的重要程度如表3所示,从中可以看出一级指标中最重要的是医疗养老服务,而人际交往对老年人幸福感的影响是最小的;在二级指标中接受的服务数量对老年人幸福感的影响是最大的,最小的是上月活动类型。

Table 3. Improved grey correlation method for ranking independent variables

表3. 改进的灰色关联法自变量排序情况

4.2.2. 改进GRA-二分类Logistic模型方程幸福感分析

根据改进GRA-二分类Logistic模型方程,由于年龄与工作满意的显著性大于0.05,因此年龄与工作满意变量对幸福感无效,对此变量不作分析。由表4可知,教育和服务数量的回归系数为正,说明受到的教育程度和接受服务的次数大概率会正向影响幸福感。服务数量成正比,接受的服务数量越多说明家庭经济情况良好。另外,由于婚姻在本研究的编码中数字越大代表的是婚姻情况不良好,所以家庭和睦与幸福感是正向关系。

Table 4. Table of equations of the improved GRA-dichotomous logistic model

表4. 改进GRA-二分类Logistic模型方程表

5. 讨论

5.1. 改进的GRA-Logistic二分类模型与RUSBoost算法的应用效果对比

经过实证分析,本研究发现在二分类问题上改进的GRA-Logistic二分类模型遇到样本不平衡的数据容易发生欠拟合现象,造成假性的高准确率;而RUSBoost算法遇到样本不平衡的数据,更能反映数据真实的分布特性,避免造成算法分类误差较大。这是因为RUSBoost算法在利用欠采样实现训练集的类别均衡的同时,又通过构建不同的训练集有效克服因欠采样而造成的信息丢失问题,从而实现对类别不平衡问题较强的适应能力 [16] 。

5.2. 医疗养老服务对老年人幸福感的影响

研究发现,医疗养老服务对幸福感的影响程度最大,医疗养老服务水平高的老年人主观幸福感较高。这说明,老年人关注自身健康,对医疗养老服务望值较高。因此,完善养老保险制度对于老年养老服务至关重要。一方面,政府应积极促进和养老保险机构的合作,改进第三支柱在养老保险体系中的短板,促使三大支柱共同促进养老 [17] 。另一方面,国家应进一步出台商业养老产品的相关政策,提高新型养老保险产品的普及性和认可度,为第三支柱发挥作用赋能“加速度”,让人们能够更好地规划养老保险消费,提升老年时代幸福感 [18] 。

5.3. 家庭关系对于老年人主观幸福感的影响

研究发现,家庭和睦与老年人主观幸福感呈正向关系。一方面,家庭和睦的老年人能减少对子女的操劳承担;另一方面,来自家人的关心和代际情感支持能使老年人在配偶、子女或其他人身上获得更大的心理慰藉。因此,国家要加快出台家庭养老政策,对需要照顾的老人的子女给予一定的支持。例如:企业对于有照顾老人需求的员工,应准许员工休假、灵活上班时间和地点。同时,通过适当发放“照顾津贴”或在社保缴纳方面提供优惠,从而减轻子女的赡养负担,提高老年人的幸福感。

5.4. 其他因素对于老年人幸福感的影响

研究发现,老年群体当中男性对比女性来说更大概率会感到幸福,男性对于精神状态和保险福利影响皆不显著,不同学历的男性关于幸福感的差异较小,而对婚姻、本地医疗服务满意程度和服务数量关于幸福感的影响上升了可说明男性更注重实际服务体验。针对男性老年群体,社区婚姻协调管理部门应更留意男性老年群体的婚姻状态,同时当地医疗服务应定时征集人们意见并进行改善,进而提高老年群体的幸福感。针对女性老年群体,由模型可知精神状态对其幸福感的影响具有显著性,因此可针对女性老年群体提供更多娱乐活动并且社区可定时对其进行拜访以留意其精神状态,及时加以帮助。

基金项目

2022年国家级、省级大学生创新创业训练计划项目(S202210592015);2023年广东省科技创新战略专项资金(pdjh2023b0220)。

参考文献

[1] Loewenstein, G., Krishnamurti, T., Kopsic, J. and McDonald, D. (2015) Does Increased Sexual Frequency Enhance Happiness? Journal of Economic Behavior and Organization, 116, 206-218.
https://doi.org/10.1016/j.jebo.2015.04.021
[2] 段建华. 主观幸福感概述[J]. 心理学动态, 1996(1): 46.
[3] 王从, 邢占军. 居住安排与老年人幸福感——基于山东省JM区和LX市的实证分析[J]. 济南大学学报(社会科学版), 2023, 33(1): 136-146.
[4] 李琴, 赵锐, 张同龙. 养老保险制度是否缓解了丧偶对老年健康的不利冲击[J]. 世界经济, 2021, 44(9): 180-206.
[5] Sperandei, S. (2014) Understanding Logistic Regression Analysis. Biochemia Medica, 24, 12-18.
https://doi.org/10.11613/BM.2014.003
[6] 付俊杰, 刘功申. 一种基于广义极值分布的非平衡数据分类算法[J]. 计算机研究与发展, 2018, 55(11): 2361-2371.
[7] Avci, O., Abdeljaber, O., Kiranyaz, S., et al. (2021) A Review of Vibration-Based Damage Detection in Civil Structures: From Traditional Methods to Machine Learning and Deep Learning Applications. Mechanical Systems and Signal Processing, 147, Article ID: 107077.
https://doi.org/10.1016/j.ymssp.2020.107077
[8] 程大伟, 牛志彬, 张丽清. 大规模不均衡担保网络贷款的风险研究[J]. 计算机学报, 2020, 43(4): 668-682.
[9] 阙霜, 曾雁冰, 方亚. 基于logistic回归与决策树模型的社会资本对老年人自评健康的影响研究[J]. 中国卫生统计, 2022, 39(2): 186-191.
[10] Nhu, V.H., Shirzadi, A., Shahabi, H., et al. (2020) Shallow Landslide Susceptibility Mapping: A Comparison between Logistic Model Tree, Logistic Regression, Naïve Bayes Tree, Artificial Neural Network, and Support Vector Machine Algorithms. International Journal of Environmental Research and Public Health, 17, Article 2749.
https://doi.org/10.3390/ijerph17082749
[11] Seiffert, C., Khoshgoftaar, T.M., Van Hulse, J. and Napolitano, A. (2010) RUSBoost: A Hybrid Approach to Alleviating Class Imbalance. IEEE Transactions on Systems, Man, and Cybernetics—Part A: Systems and Humans, 40, 185-197.
https://doi.org/10.1109/TSMCA.2009.2029559
[12] Adil, M., Javaid, N., Qasim, U., et al. (2020) LSTM and Bat-Based RUSBoost Approach for Electricity Theft Detection. Applied Sciences, 10, Article 4378.
https://doi.org/10.3390/app10124378
[13] Silvey, R. and Elmhirst, R. (2003) Engendering Social Capital: Women Workers and Rural-Urban Networks in Indonesia’s Crisis. World Development, 31, 865-879.
https://doi.org/10.1016/S0305-750X(03)00013-5
[14] 李斌, 龚晓峰. 基于某组合模型的不平衡数据分类算法研究[J]. 计算机仿真, 2022, 39(5): 292-298.
[15] 钟华星. 基于RUSBoost算法的违约风险预测模型构建与应用[J]. 财会月刊, 2020(10): 74-80.
[16] 刘云, 孙宇清, 李明珠. 面向社会化媒体用户评论行为的属性推断[J]. 计算机学报, 2017, 40(12): 2762-2776.
[17] 胡宏伟, 高敏, 王剑雄. 老年人主观幸福感的影响因素与提升路径分析——基于对我国城乡老年人生活状况的调查[J]. 江苏大学学报(社会科学版), 2013, 15(4): 48-54.
[18] 李彦如. 基于积极老龄化理念的老年人主观幸福感的影响因素研究[D]: [硕士学位论文]. 杭州: 浙江科技学院, 2021.