1. 引言
根据商务部公布的数据,截止2018年底,家政业的市场规模突破1.5万亿元,服务人员超过2500万人 [1]。虽然家政服务市场化步伐日益加快,但是家政服务业中入户服务人员的服务数量和质量结构方面却存在明显不足,信息不对称、技能不齐整等问题,导致该行业社会公信力欠佳,使得陷入结构性失衡的困境。
家政服务业的结构性不平衡问题,实则为入户服务人员的专业性分类的科学问题 [2]。通过对入户服务人员的行为和心理维度测度,选取静态属性特征作为数据的基准点,运用大数据分类算法对入户服务人员的服务专业性进行判别分析,针对判别结果,对服务的专业性进行定级考量研究,以对家政服务业的市场提供系统的技术和标准支持。
在本文中,第1节讨论了基于心理行为学实验的入户服务员人员静态属性的确定,第2节构建了基于心理行为学的大数据分类算法的判别模型,进行实验数据库判别准确率的分析,最后验证并比较数据实验结果。
2. 基于心理行为学实验的静态属性确定
2.1. 实验对象
Y企业家政服务人员。
2.2. 方法
采用依据中国员工适应性量表的问卷调查,分析不同家政服务员的工作适应性、工作满意度和心理健康属性的相关关系 [3] [4]。
1) 抽样调查
采取整群抽样的方法,将Y企业1~4星级各星级随机抽取142、572、72、9,最终样本数为795。
2) 调查方法
适应性 [5] :采用中国员工适应量表,该量表包括60个项目,包括人际关系适应、工作适应、情绪适应、自我适应和满意度等五个维度,量表采用Likert-5计分,同意–不同意计5~1分,部分题目反向统计,总分数越高表示适应能力越强。
满意度 [6] :采用Y企业员工满意度调查问卷,该调查问卷在本次研究中的区分度良好,采用Liken-5量表进行满意度评分(5 = 很满意,4 = 满意,3 = 一般,2 = 不满意,1 = 很不满意)。总满意度得分为所有调查对象满意度总分的平均分/题目;工作满意度(%) = (总满意度得分/5) × 100%。
2.3. 统计分析
应用SPSS 20.0软件对数据进行统计分析,计数资料以构成比(%)表示,以
代表计量数据,用t检验,以率或构成比(%)为计数资料,用
检验;计量资料相关分析采取Pearson相关系数表示;以P < 0.05为差异有统计学意义。
2.4. 调查结果
1) 实验一致性分析
该调查问卷在本次研究中的区分度良好,各题目校正后题总相关均大于等于0.577,全问卷内部一致性信度Cronbach α = 0.603,大于0.6,因而说明研究数据信度质量可以接受。
2) 基本信息分析
共调查795名家政服务员,其中男家政服务员118人,女家政服务员677人;1~4星级的家政服务员分别142人、572人、72人和9人;家庭户口所在地城市、城镇、农村各占7.55%、13.58%和78.87%;96.35%的家政服务员均为已婚;小学、初中、高中、大专和大学的学历占比11.45%、67.92%、17.74%、2.26%和0.63%,年龄在20岁以下、21~30岁、31~40岁、41~50岁和50岁以上的分布情况是2、118、339、313和23人。详见表1。
2.5. 实验分析
1) 适应性分析
家政服务员的适应性量表总平均分为3.91 ± 0.76分,其中自我适应、人际关系适应性、工作环境维度得分相对较高;情绪维度适应维度得分相对较低。见表2。
2) 满意度分析
家政服务员的满意度平均得分是3.71 ± 0.80,其中管理制度、工具设施和与顾客关系等维度满意度较高;在组织活动和服务质量等维度满意度较低。见表3。
2.6. 入户服务人员适应性和满意度相关因素分析
男家政服务员的各适应性平均分为(3.95 ± 0.83),高于女家政服务员的(3.90 ± 0.75),除了工作适应和自我适应维度外,男家政服务员的适应性维度平均得分也高于女家政服务员;未婚家政服务员的适应性平均分(4.05 ± 0.72),高于已婚家政服务员的适应性(3.91 ± 0.76);20岁以下、21~30岁、31~40岁、41~50岁和50岁以上的适应性平均得分分别为(4.08 ± 0.59)、(3.89 ± 0.81)、(3.90 ± 0.75)、(3.92 ± 0.76)和(4.04 ± 0.65),除去20岁以下的家政服务员,呈现随年龄升高适应性提高的趋势;小学以下、初中、高中、大专、大学及以上的适应性平均得分分别为(3.89 ± 0.83)、(3.90 ± 0.74)、(3.94 ± 0.79)、(4.03 ± 0.84)和(3.73 ± 0.31),除去大学及以上的家政服务员,呈现随学历升高适应性降低的趋势;城市户籍的适应性好于城镇和农村户籍的适应性 [7]。以上差异均具有统计学意义(P < 0.05)。见表4。
![](Images/Table_Tmp.jpg)
Table 1. Basic information of the respondents
表1. 调查对象基本情况
![](Images/Table_Tmp.jpg)
Table 2. Adaptability of household service personnel
表2. 家政服务员适应性情况
![](Images/Table_Tmp.jpg)
Table 3. Household service personnel satisfaction
表3. 家政服务员满意度情况
![](Images/Table_Tmp.jpg)
Table 4. Adaptability of different characteristics of household service personnel and scores of each dimension
表4. 不同特征家政服务员适应性及各维度得分情况
女家政服务员的满意度平均分为(3.72 ± 0.77),高于男家政服务员的(3.68 ± 0.92),除了专业认可和与顾客关系维度外,女家政服务员的适应性维度平均得分也高于男家政服务员;未婚家政服务员的满意度平均分(3.84 ± 0.78),高于已婚家政服务员的满意度(3.71 ± 0.80);呈现随年龄升高满意度提高的趋势;呈现随学历升高满意度降低的趋势;城市户籍的满意度高于城镇和农村户籍的满意度。以上差异均具有统计学意义(P < 0.05)。见表5。
![](Images/Table_Tmp.jpg)
Table 5. Satisfaction and scores of various dimensions of housekeeping waiters with different characteristics
表5. 不同特征家政服务员满意度及各维度得分情况
基于以上研究实验可以得出,在入户服务人员个体心理行为活动的静态属性确立为:性别、年龄、户籍、分数、婚姻和学历六个。
3. 基于心理行为学的大数据分类算法的判别模型构建
3.1. 算法流程构建
针对朴素贝叶斯算法特征,将入户服务人员的星级作为核心标签,从数据库样本中分出第一类数据集作为训练样本集,第二类数据集作为测试样本集进行测试。
要求出后验概率
,就需要分别求出在第三项中的各个条件概率,步骤是 [8] :
1) 训练样本集为一个已知分类的待分类项集合,这个集合叫做训练样本集。
统计得到在各类别下六个特征属性的条件概率估计。即:
2) 在朴素贝叶斯算法中,待分类项的每个特征属性都是条件独立的,由贝叶斯公式
分母相当于在第一类数据库中X存在的概率,所以对于任何一个待分类项来说
都是常数固定的,只需要求后验概率
的时候只考虑分子即可。
3) 因为各特征值是独立的,所以有:
对于
是指在训练样本中
出现的概率,可以近似的求解为:
对于先验概率
,是指在类别
中,特征属性
出现的概率,可以求解为:
3.2. 实验部分
1) 数据预处理
将Y企业原始数据进行预处理,整理出符合研究要求的属性和星级信息,最后整理出符合条件的数据有1366个总体样本,将1166个数据作为训练样本集,200个数据作为测试样本集。
具体见表6,其中年龄在20到63之间;籍贯选取身份证前两位数;性别1代表男,0代表女;分数是Y企业根据客户打分和家政服务员月薪等综合模型评定;婚姻0是代表已婚,1是代表未婚;学历1~5分别代表小学、初中、高中、大专、大学及以上;星级是1~4表示家政服务员的4个星级,其中1为最低星级,4为最高星级。详见表6。
![](Images/Table_Tmp.jpg)
Table 6. Basic property list of domestic servants in Y enterprises (part)
表6. Y企业家政服务员基本属性表(部分)
2) 分类结果
根据训练样本的代码,对测试样本集进行测试,得到200个测试样本的结果如下,见表7。
![](Images/Table_Tmp.jpg)
Table 7. Discrimination accuracy of test data samples
表7. 测试数据样本判别准确率
4. 结论
本文针对互联网家政服务企业的入户服务人员的数据库,在将入户服务人员分为核心标签为4个星级的基础上,运用心理行为的科学调研实验,确立影响心理行为因素的6个静态属性,建立基于心理行为的大数据分类算法判别模型,在对入户服务人员的训练样本集进行判别模型的初步训练基础上,实现入户服务人员数据中测试样本集判别准确率的分析。以下是研究的重要结论:
1) 围绕入户服务人员的心理行为调研实验,确立影响入户服务人员心理行为活动的六个静态属性为性别、年龄、户籍、分数、婚姻和学历。入户服务人员的属性确立在此之前是通过资深管理者的经验定性考量,本文研究融合个体心理行为活动的科学实验,以数理统计分析来实现入户服务人员的属性确立。
2) 在基于心理行为的朴素贝叶斯算法中,测试样本的分类达到了67.5%的分类准确率,大数据分类算法在互联网家政服务企业中具有很好的应用,准确率较高且具备分类代表性。