1. 引言
随着经济的发展,人们的生活水平不断提高,经济社会对家政服务员的需求增大,越来越多的劳动力投身家政行业,但是随之而来的是家政服务员的技能不齐整,整体素质和能力参差不齐,缺乏培训,社会认可度低,家政服务一度陷入价高质次的结构性失衡困境。
解决存在的结构性失衡问题,在于划分专业标准,培养专业的家政服务人员,对家政服务员分级培训,分类型培训 [1]。本文通过设计心理量表对家政服务员进行心理因素与行为属性的相关性分析,选取影响家政服务员专业性的心理行为属性,运用大数据分类算法对家政服务员专业性进行分类,对家政服务员的专业性进行定级考量研究,为家政服务领域提供识别家政服务员专业性的新的技术和理论标准。
本文第一节进行心理因素与行为属性的相关性分析,确定相关的心理行为属性,第二节构建基于心理行为属性的大数据算法分类模型,分析家政服务员专业性分类准确率,最后验证并比较分类实验结果。
2. 基于心理行为测度的行为属性确定
2.1. 调研对象
Y企业在职家政服务人员。
2.2. 实验方法
基于职业倦怠–服务行业版(MBI-HSS)心理量表的情绪耗竭、去人性化、个人成就感三个维度共设计了8个问题 [2];基于护士职业认同量表设计了职业认同心理因素下自我认同、家人认同、社会认同的8个问题 [3];基于心理契约量表从店长、发展、薪酬、决策4个维度设计了12个问题 [4]。分析心理因素与行为属性之间的相关关系。
1) 抽样方法
本文运用整群抽样的方法抽取Y企业1~3星的家政服务员230人、292人、135人。
2) 计分方法
心理契约、职业认同因素问卷采用Likert-5分量表法进行计分(1 = 不同意,2 = 有点不同意,3 = 一般,4 = 有点同意,5 = 同意),在题目设置上会采用反向统计 [5]。职业倦怠因素同样采用Likert-5量表进行计分(1 = 从来没有这样,2 = 很少这样,3 = 有时候这样,4 = 经常这样,5 = 几乎每天都这样),在题目设置上同样会采用反向统计 [6]。最终总分数越高表示家政服务员的心理状态越好。
2.3. 统计分析
运用SPSS 26.0软件进行统计分析,计数占比用百分比(%)表示,以表示家政服务员在各个心理维度的得分,进行检验。心理因素与行为属性相关性采用皮尔逊相关系数进行衡量,在p < 0.05或p < 0.01上有显著性差异具有统计学意义。
2.4. 调研结果
1) 实验信度分析
整体问卷的克隆巴赫系数为0.845,大于0.8,说明问卷的可靠性较高;该问卷修正后的项与总计相关性越高表示该题与其他题项之间的一致性越高,一般大于0.4为佳,18、20、21、22、24、25题修正后的项与总计相关性远小于0.4,需要进行优化;对每一项题目进行删除后得到新的克隆巴赫系数,18、20、21、22、24、25题项删除后的系数大于0.845,问卷的整体信度获得提升。
2) 基本信息分析
问卷调查家政服务人员数为657名,其中男家政服务员104人,女家政服务员553人,各占15.8%,84.2%;1~3星级的家政服务员分别为230人,292人,135人。依据受教育程度(小学及以下、初中、中专、高中、大专、本科及以上)从低到高的占比分别为13.1%、67.0%、6.4%、9.7%、2.7%、1.1%,详情见表1。
![](Images/Table_Tmp.jpg)
Table 1. Basic information table of respondents
表1. 调查对象基本情况表
2.5. 实验分析
2.5.1. 心理因素分析
1) 职业认同心理维度分析
家政服务员在职业认同心理量表上的总平均分为4.555 ± 0.845,其中家人认同、社会认同的得分较高,自我认同的得分较低,详情见表2。
2) 心理契约心理维度分析
家政服务员在心理契约心理量表上的总平均分为4.187 ± 1.127,其中店长维度、发展维度的得分较高,薪酬维度、决策维度的得分较低,详情见表3。
3) 职业倦怠心理维度分析
家政服务员在职业倦怠心理量表上的总平均分为2.885 ± 1.145,其中个人成就感维度的得分较高,情绪耗竭、去人性化维度的得分较低,详情见表4。
![](Images/Table_Tmp.jpg)
Table 2. Score of psychological dimension of professional identity
表2. 职业认同心理维度得分
![](Images/Table_Tmp.jpg)
Table 3. Score of psychological dimension of psychological contract
表3. 心理契约心理维度得分
![](Images/Table_Tmp.jpg)
Table 4. Score of psychological dimension of job burnout
表4. 职业倦怠心理维度得分
2.5.2. 心理行为属性相关性分析
1) 职业认同心理因素与行为属性的相关分析
职业认同与技能数量的相关系数为0.101,职业认同与客户是否继续接受服务的相关系数为0.108,并在p < 0.01的级别上呈现显著的相关性。职业认同与总评分的相关系数为0.094,并在p < 0.05的级别上呈现显著的相关性。结果表明,职业认同与行为属性之间呈现显著的正相关关系,表明职业认同感高的家政服务员会对行为产生正向的影响,详情见表5。
2) 心理契约心理因素与行为属性的相关分析
心理契约与培训次数的相关系数为0.106,并在p < 0.01的级别上呈现显著的相关性。职业认同与月度合作费的相关系数为0.090,并在p < 0.05的级别上呈现显著的相关性。结果表明,心理契约与行为属性之间呈现显著的正相关关系。心理契约感强的家政服务员更愿意参加培训提升自己的专业能力,获得更多的报酬,详情见表6。
3) 职业倦怠心理因素与行为属性的相关分析
职业倦怠与请假次数的相关系数为0.096,并在p < 0.05的级别上呈现显著的相关性。职业倦怠与是否准时的相关系数为−0.116,职业倦怠与订单量的相关系数为−0.117,并在p < 0.01的级别上呈现显著的相关性。职业倦怠与准时到达、订单量呈现显著的负相关,结果表明,强职业倦怠感会对家政服务员的行为表现产生消极的影响,详情见表7。
![](Images/Table_Tmp.jpg)
Table 5. Correlation analysis between professional identity and behavioral attributes
表5. 职业认同与行为属性的相关分析
**:在0.01级别(双尾),相关性显著。*:在0.05级别(双尾),相关性显著。
![](Images/Table_Tmp.jpg)
Table 6. Correlation analysis between psychological contract and behavioral attributes
表6. 心理契约与行为属性的相关分析
**:在0.01级别(双尾),相关性显著。*:在0.05级别(双尾),相关性显著。
![](Images/Table_Tmp.jpg)
Table 7. Correlation analysis between job burnout and behavioral attributes
表7. 职业倦怠与行为属性的相关分析
**:在0.01级别(双尾),相关性显著。*:在0.05级别(双尾),相关性显著。
基于以上心理行为实验研究可知,确定影响家政服务员专业性的心理行为属性为:技能数量、是否被推荐、招聘来源、总评分、服务质量评分、服务态度评分、客户是否继续接受服务、店长信息、培训次数、月度合作费、请假次数、是否准时、订单量。
3. 融合心理行为的家政服务员专业性分类模型构建
3.1. 大数据分类算法流程构建
针对有监督类型的XGBoost分类算法的分类特征 [7],将家政服务员的星级作为标签,心理行为属性以及基础属性作为分类属性基准点,以7:3的比例将数据库数据集分为训练集和测试集,平衡训练数据集建立家政服务员专业性分类模型。
1) XGBoost模型定义 [8]
XGBoost是一种有监督的学习算法,由多棵决策树构成。假设存在数据集
,其中
,
,
。xi代表属性向量,维度为m,yi代表样本的标签值。假设模型由T棵决策树组成,则模型的目标函数定义为:
(1)
其中,yi表示经第t轮迭代后的模型预测值,yi表示已知t-1个基础模型的预测值,
表示第t个决策树。每棵决策树都根据属性划分样本类别,使得各样本被分到决策树的叶子节点上,某个叶子节点的权重w即为样本分到此叶子节点上时在此决策树的预测值。将样本在所有叶子节点的权重加和,即为在XGBoost模型上的预测值。
为避免模型复杂度增加,防止出现过拟合等问题,XGBoost模型的目标函数为:
(2)
第一项为损失函数,用于表示样本真实值与模型预测值之差。
为第j个基础模型的正则项。
的定义如下:
(3)
其中,T表示叶子节点的个数,
表示L2正则项。来控制叶子节点的权重,保证各个叶子节点的重要性不会相差太大。CART树生长得越复杂,对应的T越大,
也越大。
2) 目标函数近似估计
由于很难使用传统的方法对目标函数进行优化,XGBoost使用近似估计的方法优化目标函数:
(4)
表示样本xi在t-1个基础模型上的预测值,
表示第t个训练的决策树。
XGBoost模型用泰勒公式对损失函数做近似估计,泰勒公式可以用一个点的函数值表示一个这个点附近的函数值,它用该点的各阶导数构建一个多项式来对该点附近的函数值做近似。
泰勒展开式为:
(5)
其中,f(x)是一个具有二阶可导的函数,f(x)'为f(x)的一阶导函数,f(x)为f(x)的二阶导函数,Δx为f(x)在某点处的变化量。假设令损失函数L为泰勒公式中的f,令损失函数中
项为泰勒公式中的x,令损失函数中
项为泰勒公式中的Δx,则目标函数
可以近似表示为:
(6)
gi和hi分别是损失函数
关于
的一阶导函数值和二阶导函数值,即他们可以表示为:
(7)
常数项不会对结果产生影响,去掉常数项
,并将
的表达式带入目标函数,则目标函数为:
(8)
3) 最优目标函数和叶子权重
表示第t棵树,是XGBoost模型的一个基础模型,wj表示叶子节点的权重,进一步优化目标函数可得:
(9)
是第t棵树中1到T中的某个叶子节点的权重值。
采用叶子节点遍历,计算损失函数,可得损失函数为:
(10)
其中,Ij是第j个叶子节点的样本集,第t个树模型
将样本分到叶子节点,则其在该叶子节点的权重为w,所以当i在Ij中时,可以用wj代替
。
令
;
。它们分别表示所有属于叶子节点j的样本点对应的gi之和以及hi之和。所以目标函数是寻找一个合理的ft,使得式子
尽可能大地减小。对其求偏导数,令导函数为0,可得:
(11)
将wj的值导入到目标函数
中,可得:
(12)
容易计算出分裂前后损失函数的差值为:
(13)
其中,G和H分别代表当前节点的一阶导函数值和二阶导函数值的和,GR和GL代表在当前节点划分出的右子节点和左子节点样本集的一阶导函数值的和;HR和HL分别表示在当前节点划分出的右子节点和左子节点样本集的二阶导函数值的和。
XGBoost依据分裂前后损失函数相差最大的那个特征进行首次分裂,依次进行。而分裂前后的损失函数差值一定是正的,这也起到了预剪枝的作用。
3.2. 实验分析
本文基于学者研究的学历、婚姻、性别、年龄、户籍的基础上融合心理行为属性进行家政服务员专业性分类预测。
1) 数据预处理
通过对Y企业数据进行清洗和分析,对缺失值和异常值进行处理之后,符合家政服务员专业性的相关属性和星级数据共1239个样本。按照7:3的比例将样本分为训练数据集和测试数据集。
婚姻状况未婚、已婚、离异分别表示为1、2、3。性别1代表男,0代表女。学历划分为小学及以下为1、初中为2、中专为3、高中为4、大专为5、本科及以上为6。籍贯取身份证前2位数字。星级1~3代表家政服务员的3个星级,1为最低星级,3为最高星级,详情见表8。
![](Images/Table_Tmp.jpg)
Table 8. Examples of partial sample processing results
表8. 部分样本处理结果示例
2) 分类结果分析
家政服务员数据集中1星级、2星级、3星级3个类别数据分布不平衡,在分类时会造成模型偏向占比较大的类别,为此要进行数据集的平衡化处理。首先输入未经平衡化的训练集,采用默认参数建立融合心理行为属性的XGBoost算法的家政服务员专业性分类模型作为参照,然后引入SMOTE算法对训练集数据进行平衡后,采用调优后的参数建立融合心理行为属性的XGBoost算法的家政服务员专业性分类模型。对比测试数据集在这两种分类模型上的预测结果,详情见表9。
![](Images/Table_Tmp.jpg)
Table 9. Comparison of the effect of classification models of balanced data and unbalanced data
表9. 平衡数据与非平衡数据分类模型效果对比
平衡训练数据集之后建立的家政服务员专业性分类模型,命名为模型1。测试集的分类准确率为79.8%。非平衡训练数据集建立的家政服务员专业性分类模型,命名为模型2,测试集的分类准确率为80.4%。模型1与模型2相比,在1星级上的召回率降低了1个百分点,在2星级上的召回率降低了1个百分点;但是在3星级上的召回率提高了10个百分点。而且3星级的精确率降低了5个百分点,说明平衡数据之后,模型可以更好地识别样本量占比较小的3星级样本,但是也把其他星级的样本识别为3星级样本。由此可见,模型分类召回率的提升是以降低分类精确率为代价的。模型1的F1-score高于模型2,表明模型1的分类性能优于模型2。
4. 研究结论
本文设计心理量表进行调查实验,并依据互联网家政企业的丰富的数据资源,进行心理因素与行为属性的相关性分析,确定影响家政服务员专业性的心理行为属性,在对家政服务员不平衡级别的数据基础上,平衡训练数据集建立家政服务员专业性分类模型,并且利用测试集数据对比平衡数据前后建立的家政服务员专业性分类模型的准确率,以下是研究结论:
1) 对心理因素与行为属性进行相关性分析,确定影响家政服务员专业性的心理行为属性包括技能数量、是否被推荐、招聘来源、总评分、服务质量评分、服务态度评分、客户是否继续接受服务、店长信息、培训次数、月度合作费、请假次数、是否准时、订单量。通过访谈发现,基层资深管理者依据经验进行家政服务员专业性判别,本文依据心理量表实验,从统计学角度确定影响家政服务员专业性的心理行为属性。
2) 在融合心理行为属性的XGBoost算法中,平衡训练数据集建立的分类模型中测试集数据的分类准确率达到了79.8%,并且在占比较小的类别上有很好的分类表现,大数据分类算法在家政服务员专业性判别上有较好的应用效果,为企业建立专业标准、培养专业人才提供了新的思路。