1. 引言
1.1. 研究背景
“内卷”作为近年来热门的社会性词语,在一定程度上反映了“大城市化”推进下当前一线城市人口规模大、人才密度高、竞争强度高的社会氛围。青年作为富有强创造力的群体,他们之中有不少人厌倦了随波逐流的生活方式,开始主动寻求生活方式上的转向,希望脱离无休无止的内卷生活。从就业方面来看,“反向就业”是当代青年对大城市就业机会的理性评估与理智选择[1],具体表现为:越来越多的青年选择主动降低薪资待遇、行业类别和发展前景等主观工作期望[2],从一线或者超一线大城市转向到中小城市就业;而对于未就业大学生群体来说,是不再选择留在学校所在城市或是去到其他更发达的大城市寻找工作,而是选择“回到老家”,去到更小的城市和乡镇就业[3]。对于传统“向上流动”的就业模式来说,这是一种“下沉式就业”形态。
在对青年大学生“反向就业”价值取向、倾向变化及其影响因素的研究中,刘彦林和马莉萍(2019)认为,高校毕业生选择反向就业的影响因素主要包括良好的地理、经济条件,工作舒适度以及能够兼顾家庭与亲友的因素[4]。胡小武(2023)认为,青年选择“反向就业”原因在于,面对大城市高企的房价和激烈的人才竞争压力,选择回到小城市、县城或乡村,进行“向下流动”。这表明青年对于大城市生活的不适应,以及对于更平和、低压力生活的向往[1]。杨伊宁(2020)指出,青年个人对乡村振兴的认知重构与文化自觉也是选择“反向就业”的原因之一[5]。黄心苑(2022)则认为,大学生反向创业就业的内部动力来自于大众媒体对于“返乡创业观念”的引导和创业平台的搭建,外部动力则在于完善的社会配套保障和政策驱动等[6]。
综合多位学者的研究,我们可以发现青年群体选择“反向生活”或“反向就业”背后的动力和社会机理并非单一,而是涵盖了多个方面。首先,青年群体的选择反映了对传统价值观的重新审视:随着社会变革和个体认知的提升,青年们逐渐认识到传统的成功观念并非唯一标准,开始重新思考生活与工作的意义和目标。其次,政策引导也是重要的影响因素。政府在制定政策时,可能会考虑到促进较不发达地区经济发展、人口流动等因素,采取一系列措施鼓励大学生反向就业,从而引导他们的就业方向。此外,激烈竞争环境下的理性选择和自觉反应也推动了青年群体向反向生活转变。面对高房价、激烈竞争等问题,青年们开始审视自身资源和环境,理性地选择更适合自己发展的生活方式和职业道路。
1.2. 研究目的及意义
我国人力资源保障部高度关注并重视就业问题,2023年政府资金支持就业超3000亿元,且明确突出就业优先导向,加快完善高质量充分就业促进机制。而上海作为一个海纳百川的大都市,在人才竞争趋于饱和的背景之下,其中已经有很多为了生活而奔波的非沪籍青年准备或者已经进行“反向就业”。
因此,本文基于上述现象,以上海市为例,从群体特征视角出发,理解和探究越来越多的非沪籍青年地选择“反向就业”方式的社会机理。从而探寻“反向就业”机制完善路径,帮助“反向就业”接收地进行相对应的政策支持,缓解不同地区就业市场的供需失衡问题,以促进劳动力市场的和谐与可持续发展。
2. 数据获取与处理
2.1. 样本容量的确定
2.1.1. 初始样本量的确定
在实施正式调查前,我们首先对入样的33个街道进行了一次预调查。根据预调查中回收的144份问卷,统计得出预调查问卷有效率为87.27%,以无效问卷率12.73%作为期望无效问卷率p,则绝对允许误差
[7]。在置信度为99%的情况下,根据公式,可得修正前最佳样本量为:
(1)
2.1.2. 根据总体调整样本量
查找上海市第七次全国人口普查年鉴有关数据,得知2020年末上海市非沪籍青年人合计4,733,483人。
(2)
2.1.3. 根据设计效应调整样本量
据相关文献和经验规则[8],本报告假定多阶段抽样的设计效应(Design effect)为2.1,则应回收的有效样本量为:
(3)
2.1.4. 结合预计有效率调整样本量
考虑到正式调查问卷发放过程中会出现无效问卷的情况,参考预调查有效率,以87.27%为预计有效问卷回收率对样本量进行调整,得出最终所确定的调研所需最小问卷样本数量为:
(4)
在预调查过程中,调查组发现选择反向就业的目标调查群体数量较少,为使分析出的数据更具代表性,并综合考虑问卷发放过程中的抽样偏差和不确定性因素,拟发放问卷1628份。
2.2. 数据回收与筛选
确定样本量后,调查组在入样的33个街道街头随机拦访青年、入户调查,同时也走进上海市部分大学发放问卷。为提高收回的问卷数据质量,对采访者漏答和回答问题形式不正确等问题,将其作为无效问卷进行剔除,最终得到有效问卷1550份,问卷有效率95.21%。其中选择反向就业样本478份,未选择反向就业样本1072份。
3. 描述性统计分析
3.1. “反向就业”的意愿及去向
在“反向就业”意愿统计分析中,如图1所示:虽然有超过三分之二的上海市非沪籍青年选择继续留在上海就业,但仍有31%的受访者有意愿进行反向就业,即他们希望离开上海(等一线城市)工作和生活,占据了相当的比例。同时在对他们的意向就业城市统计时,较多选择“反向就业”的上海市非沪籍青年选择前往杭州等新一线城市,同时选择前往二三线城市和四五线城市的受访者比例大致相同,均为29%。
Figure 1. “Reverse employment” willingness and destination of non-shanghai youths in Shanghai chart
图1. 上海市非沪籍青年“反向就业”意愿及去向图
3.2. “反向就业”推动力因素
选择“反向就业”的受访者提出的不在一线城市进行就业或定居的因素按重要性排序均值如图2所示:分别为4.48、4.63、4.7、4.64、4.65、3.24、4.74、4.9。其中,交通拥挤和就业竞争大排序均值为4.9和4.74,是受访者认为推动他们不在一线城市进行就业或定居的最主要因素。其次是教育成本较高,排序均值为4.7。生活节奏快、房价高以及居住成本高昂、政府不完善三个因素排序均值相当,医疗成本较高因素排序均值3.24,为最次要因素。
Figure 2. Factors that prevent “reverse employment” youth from taking up employment or settling in first-tier cities chart
图2. “反向就业”青年不在一线城市进行就业或定居的因素图
3.3. “反向就业”吸引力因素
选择“反向就业”的受访者对于“反向就业”的吸引力按重要性排序均值如图3所示:分别为3.96、4.53、3.67、4.72、4.55、4.39、4.85、4.92。其中,地块小,通勤时间短和就业机会多是最为突出的两个吸引力,排序均值分别为4.92和4.85。发展空间广阔、竞争压力较小以及政策帮扶力度大排序均值分别为4.72、4.55、4.53紧随其后。而城市环境好(空气清新、自然资源丰富等)排序均值为3.67,较为不重要。
Figure 3. Attractiveness factors of “reverse employment” areas chart
图3. “反向就业”地区吸引力因素图
4. 基于K-Means聚类算法的反向就业群体及非反向就业群体特征分析
为了进一步研究反向就业与选择留在一线城市(北上广深)的非沪籍青年的群体特征,本文利用K-Means聚类算法对两类群体进行特征分析,描绘反向就业群体与非反向就业群体的画像。
4.1. K-Means聚类模型的建立
4.1.1. 聚类因子的选取
本文从问卷调查项目中选取了以下7个基本特征作为聚类分析的指标:性别、年龄、学历(包括在读和最高学历)、收入、是否有亲属(父母、子女、配偶)在上海市内、户口类型、原户籍所在地。
4.1.2. 模型建立
K-Means作为一种典型的基于划分的聚类算法,也是一种迭代求解的算法,其步骤主要为:首先从数据集中随机选取k个点作为聚类中心,计算其余样本数据到聚类中心的欧式距离,将样本分配到距离最近的聚类中心所在的簇中,然后计算每个簇样本数据的平均值并将其作为新的聚类中心,再进行下一次迭代,直到聚类中心不再改变为止。
空间中,样本与聚类中心的欧式距离计算公式为:
(5)
其中,X为样本数据;Ci为第i个聚类中心;m为样本数据的维度,该模型中m = 7;Xj,Cij分别为X和Ci的第j个属性值。
4.1.3. 聚类中心数量的确定
聚类中心数量,即k值的确定对聚类结果的影响较大,本文使用手肘法来确定最优的k值。手肘法的核心指标是SSE,即误差平方和,也就是所有样本的聚类误差,其计算公式为:
(6)
其中,Ci为第i个聚类中心,p是Ci的样本点,mi是Ci的质心。
随着k值的增大,每个簇的聚合程度会逐渐提高,SSE的值会逐渐减小,而SSE的下降幅度骤减形成的“肘部”所对应的k值就是所求的最佳聚类数。由python绘制的SSE值与k的函数图像如图4所示。由图可知,本次反向就业与非反向就业群体样本的最佳聚类数均为4。
Figure 4. Reverse employment group SSE-K value chart, non-reverse employment group SSE-K value chart
图4. 反向就业群体SSE-K值图,非反向就业群体SSE-K值图
4.2. 反向就业青年聚类分析结果
在选择反向就业青年样本簇数为最优的4时,提取聚类中心最具代表性的特征,可得到反向就业青年聚类结果如表1所示。
Table 1. Comparison results of variance analysis of clustering category of reverse employment youth
表1. 反向就业青年聚类类别方差分析差异对比结果
反向就业青年聚类类别方差分析差异对比结果(平均值 ± 标准差) |
|
类型1 (n = 155) |
类型2 (n = 112) |
类型3 (n = 71) |
类型4 (n = 140) |
F值 |
P值 |
性别 |
1.59 ± 0.49 |
1.50 ± .50 |
1.49 ± 0.50 |
1.49 ± 0.50 |
1.454 |
0.226 |
年龄 |
1.95 ± 0.69 |
4.19 ± 1.13 |
3.11 ± 1.51 |
4.42 ± 1.13 |
156.209 |
0.000*** |
学历 |
0.25 ± 0.66 |
1.35 ± 0.58 |
1.27 ± 1.26 |
3.71 ± 0.90 |
443.741 |
0.000*** |
收入 |
2.59 ± 0.51 |
1.52 ± 0.50 |
2.49 ± 0.73 |
3.34 ± 0.47 |
238.617 |
0.000*** |
亲属 |
0.15 ± 0.36 |
0.93 ± 0.26 |
0.58 ± 0.50 |
0.80 ± 0.40 |
116.580 |
0.000*** |
户口类型 |
1.33 ± 0.47 |
1.48 ± 0.50 |
1.32 ± 0.47 |
1.51 ± 0.50 |
4.803 |
0.000*** |
原户籍 所在地 |
1.00 ± 0.00 |
1.01 ± 0.09 |
2.06 ± 0.23 |
1.04 ± 0.20 |
983.679 |
0.000*** |
4.3. 非反向就业青年聚类分析结果
同理可得非反向就业青年如表2所示。
Table 2. Comparison results of variance analysis of clustering category of non-reverse employment youth
表2. 非反向就业青年聚类类别方差分析差异对比结果
非反向就业青年聚类类别方差分析差异对比结果(平均值 ± 标准差) |
|
类型1 (n = 292) |
类型2 (n = 228) |
类型3 (n = 159) |
类型4 (n = 393) |
F值 |
P值 |
性别 |
1.53 ± 0.50 |
1.54 ± .50 |
1.58 ± 0.49 |
1.47 ± 0.50 |
2.428 |
0.064* |
年龄 |
2.39 ± 1.07 |
2.65 ± 1.30 |
3.47 ± 1.62 |
4.59 ± 1.05 |
223.666 |
0.000*** |
学历 |
2.25 ± 0.74 |
2.24 ± 0.77 |
2.65 ± 0.76 |
2.96 ± 0.67 |
73.464 |
0.000*** |
收入 |
0.49 ± 0.78 |
0.71 ± 0.97 |
1.89 ± 1.72 |
3.29 ± 1.10 |
440.921 |
0.000*** |
亲属 |
0.34 ± 0.47 |
0.37 ± 0.48 |
0.55 ± 0.50 |
0.85 ± 0.36 |
94.880 |
0.000*** |
户口类型 |
1.00 ± 0.00 |
2.00 ± 0.00 |
1.33 ± 0.47 |
1.33 ± 0.47 |
380.156 |
0.000*** |
原户籍 所在地 |
1.00 ± 0.00 |
1.00 ± 0.00 |
2.08 ± 0.27 |
1.00 ± 0.00 |
4725.923 |
0.000*** |
4.4. 结论分析
从画像结果来看,选择反向就业和非反向就业的上海市非沪籍青年群体在性别、有无亲属在上海市内、原户籍所在地上无显著差异。但在不考虑学生群体的情况下,反向就业群体的年龄普遍大于非反向就业群体,而非反向就业群体的学历、收入普遍高于反向就业群体,同时城镇户口的群体更偏向留在北上广深等一线城市就业。值得注意的是,选择反向就业的第四类群体,他们的学历和收入都较高:本科及以上学历、收入在20,000~50,000元左右,却依旧选择反向就业,原因可能是大城市生活、工作、晋升压力过大,他们希望通过反向就业来到一个更轻松自由的环境或谋求更大发展空间。
综上所述,反向就业意愿和年龄呈正向关系,和学历、收入呈反向关系,和性别、有无亲属在上海市内、原户籍所在地无显著关系,同时城镇户口群体更愿意选择留在一线城市就业。但学历、收入等综合条件较高的群体,考虑到晋升、工作压力等问题,他们的反向就业意愿也较高。
5. 基于Logit回归上海市非沪籍青年反向就业影响因素的模型分析
上海市非沪籍青年是否会选择反向就业受到各种因素的影响。因此有必要通过建立计量模型进一步考察年龄、学历、月收入、在上海生活时间等因素对是否选择反向就业的影响,进而确定群体的显著特征。
考虑到反向就业意愿是一个二分类变量,只涉及“是”、“否”两种回答,因此选择二元Logit回归,建立二元选择模型。
5.1. Logit模型建立
二元Logit回归模型的表达式为:
(7)
二元回归模型一般选用极大似然估计进行参数估计,设
的概率为p,可得
的概率为1 − p,则可以得到二元Logit模型的对数似然函数:
(8)
通过对公式(8)求最大值,即可得到模型的待估参数[9]。
5.1.1. 变量选择与定义
将“(毕业后)是否有留沪或前往其他几个一线城市(北广深)长期就业(五年及以上)的意愿”作为判断是否反向就业意愿的标准,并将其表示为因变量:当选择“是”时,说明无反向就业意愿,y取值为0;当选择“否”时,说明有反向就业的意愿,y取值为1。
在构建回归模型时,当自变量x为连续性变量时,回归系数β表示其他自变量不变的条件下,x每改变一个单位,所引起的y的平均变化量;当自变量为二分类变量时,回归系数β则表示其他自变量不变的条件下,x = 1与x = 0相比,所引起的y的平均变化量。但当x为无序多分类变量,例如学历等,此时如果仅用一个回归系数来解释自变量与因变量之间的关系,就显得不太合理。因此需要将多分类变量转化为哑变量,使模型回归结果更具有现实意义。
结合上文聚类分析结果,本节选取了年龄、学历、月收入、在上海生活时间作为自变量,变量定义如表3所示。
5.1.2. 变量选择与定义
建立如下二元Logit模型:
(9)
其中,P为Y = 1的概率,即选择反向就业的概率,X为自变量,β为自变量的系数。
给定显著水平为0.05,得到Hosmer-Lemeshow检验(HL检验)结果如表4所示。
Table 3. Table of Logit variable definition
表3. Logit变量定义表
变量名 |
变量符号 |
变量定义 |
反向就业意愿 |
Y |
|
年龄 |
Age18-20 Age21-23 Age24-26 Age27-29 Age30-32 |
以33~35岁为基准水平 |
学历 |
High College Postgraduate |
将硕士、博士研究生合并 以本科为基准水平 |
月收入 |
Income0 Income0-5000 Income5000-10000 Income10000-20000 Income20000-50000 |
以50,000元以上为基准水平 |
在上海生活时间 |
Live0-1 Live1-3 Live3-5 |
以5年以上为基准水平 |
Table 4. HL test result
表4. HL检验结果
HL检验显著性为0.708,大于0.05,说明预测值与真实值之间无明显差异,模型拟合度较好。
5.2. Logit回归结果
回归结果如表5所示。
Table 5. Regression result
表5. 回归结果
变量 |
系数 |
显著性 |
Exp(B) |
Age18-20 |
−1.884 |
0.042** |
0.152 |
Age21-23 |
−1.262 |
0.181 |
0.283 |
Age24-26 |
−1.347 |
0.000*** |
0.260 |
Age27-29 |
−0.707 |
0.001*** |
0.493 |
Age30-32 |
−0.667 |
0.004** |
0.513 |
High |
1.609 |
0.000*** |
4.997 |
College |
1.539 |
0.000*** |
4.658 |
Postgraduate |
−0.594 |
0.050** |
0.552 |
Income_0 |
0.730 |
0.114 |
2.075 |
Income_below_5000 |
1.813 |
0.069* |
6.129 |
Income5000-10000 |
1.058 |
0.004** |
2.881 |
Income10000-20000 |
0.863 |
0.014** |
2.370 |
Income20000-50000 |
0.165 |
0.673 |
1.180 |
Live_below_1 |
0.007 |
0.973 |
1.007 |
Live1-3 |
0.218 |
0.147 |
1.244 |
Live3-5 |
0.197 |
0.216 |
1.218 |
constant |
−1.465 |
0.000*** |
0.321 |
注:***、**、*分别表示在显著性水平为0.01、0.05、0.1时系数显著。
剔除不显著的变量后,可得到二元选择模型为:
(10)
5.3. 结论分析
5.3.1. 反向就业意愿与年龄呈正向关系
以33~35岁为基准水平时,除21~23岁年龄段外,其余年龄组反向就业意愿显著,且系数均为负数,说明越小年龄段的青年群体选择反向就业的意愿越弱。其中,18~20岁的群体选择反向就业的积极性只有基准类33~35岁的15.2%,且随着年龄的增长,选择反向就业的概率在逐渐增加。
5.3.2. 反向就业意愿与学历呈反向关系
以本科学历为基准水平时,高中及以下和专科学历的反向就业意愿更强,硕士研究生以上学历的反向就业意愿更弱。高中及以下学历的反向就业意愿比本科高3.997倍,专科(高职、大专、高技)学历的反向就业意愿比本科高3.658倍。而硕士及以上学历的反向就业意愿只有本科学历的55.2%。
5.3.3. 反向就业意愿与收入呈反向关系
以月收入在50,000元及以上为基准水平时,收入在20,000元以下的群体反向就业意愿更强。其中,月收入在10,000~20,000元的反向就业意愿比基准组高1.37倍,月收入5000~10,000元群体的反向就业意愿比基准组高1.881倍。而月收入在5000及以下的反向就业意愿是基准组的6.129倍。
6. 结论与建议
6.1. 结论
本文对上海市非沪籍青年反向就业意愿的影响因素进行了探究,结果表明:促使青年选择反向就业,离开上海的第一大原因是交通拥挤,其次是生活节奏快,房价、居住成本高,就业竞争大;而吸引“反向就业”青年前往意向就业地的原因主要有通勤时间短,就业机会多,发展空间广阔等。同时,年龄、学历、收入等因素显著影响了反向就业意愿,这也侧面反映了一线城市通勤时间过长、工作压力大、职场竞争激励、生活成本高是导致上海市非沪籍青年选择反向就业的重要原因。另一方面,在综合条件较高的群体中,拥有较高学历和较高收入的一类人的反向就业意愿也较高,这反映出这类群体对一线大城市生活和工作环境压力感到疲倦,他们希望通过反向就业寻找更轻松自由的生活与发展空间。
6.2. 对策建议
虽然较多选择“反向就业”的受访者学历水平较高,他们来到意向就业地后能够很快找到稳定且待遇较好的工作;但仍有部分受访者学历不高且生活也面临着巨大压力,他们做出如此选择更多是无奈之举。因此,针对不同学历层次的上海市非沪籍青年,政府可以制定更为个性化、灵活化的人才引进政策,形成不同层级的人才储备库。例如,针对具有较高学历和较高收入的群体,可以提供更多就业后的进一步深造的机会,以提升专业技能以及开阔眼界,从而满足其自我发展需求;针对学历较低的群体,政府可与企业合作,提供“联培”政策,并制定相应的薪酬标准,确保低学历青年也能够获得相对稳定和可观的收入,提高职业发展空间。
另一方面,许多受访者表示大城市生活成本过高,有了孩子以后更难以承担这样的负担。所以,对于同样面临该问题的“反向就业”人群,应聚焦其基本生活保障以及生活成本问题,例如提供公共租赁房、提供生活补贴、住房补贴等,进一步降低生活成本,保障反向就业青年的基本生活需要。同时提高城市交通便捷性,提高交通网络的密度和质量能够满足“反向就业”人群的出行需求。再者是,关注水电供应保障方面,并在此基础上推动互联网覆盖全城,提高城市的数字化水平,并发展智慧城市技术,提升城市管理和服务水平。
只有考量“反向就业”人群的切实需求,通过按照个人需求制定差异化的方案,尽可能地扩大覆盖面,才能有针对性地进行完善,提升“反向”就业地的吸引力。