我国主要城市消费结构分析——基于因子分析和聚类分析
Analysis of Consumption Structure in Major Cities in China—Based on Factor Analysis and Cluster Analysis
DOI: 10.12677/sa.2024.133060, PDF, HTML, XML, 下载: 32  浏览: 142 
作者: 高明月:广西师范大学数学与统计学院,广西 桂林
关键词: 消费结构因子分析聚类分析Consumer Structure Factor Analysis Cluster Analysis
摘要: 消费结构是宏观经济中的一个重要概念,它揭示了人们在日常生活中如何分配他们的支出,以及这种分配如何受到文化、经济和社会因素的影响。本文选取了31个省市的人均消费支出的8项关键数据,这些数据涵盖了居民生活从食品烟酒到居住、交通通信,再到教育文化娱乐等各个方面,我们对这31个省市的居民消费结构进行了深入剖析,首先通过因子分析提取出主要的消费因子,然后通过聚类分析将消费者划分为不同的群体,从而更加深入地了解我国消费结构的特征和变化。由分析结果可知,我国消费结构从追求基本的生活需求转向追求更高的生活品质,教育、医疗、文化娱乐等服务型消费成为新的增长点,不同城市之间的消费结构呈现出多样化,并且根据分析结果提出了合理化建议。
Abstract: Consumption structure is an important concept in macroeconomics, which reveals how people allocate their expenses in daily life and how this allocation is influenced by cultural, economic, and social factors. This article selects 8 key data points of per capita consumption expenditure from 31 provinces and cities, covering various aspects of residents’ life, from food, tobacco and alcohol to housing, transportation and communication, and then to education, culture and entertainment. We conducted an in-depth analysis of the consumption structure of residents in these 31 provinces and cities. Firstly, we extracted the main consumption factors through factor analysis, and then divided consumers into different groups through cluster analysis, in order to gain a deeper understanding of the characteristics and changes of China’s consumption structure. According to the analysis results, it can be seen that China’s consumption structure has shifted from pursuing basic living needs to pursuing higher quality of life, and service-oriented consumption such as education, medical care, and cultural entertainment has become a new growth point. The consumption structure between different cities has shown diversification, and reasonable suggestions have been proposed based on the analysis results.
文章引用:高明月. 我国主要城市消费结构分析——基于因子分析和聚类分析[J]. 统计学与应用, 2024, 13(3): 600-607. https://doi.org/10.12677/sa.2024.133060

1. 引言

近年来,我国的消费结构正在经历升级和转型,李晓钟和韩本登[1]从纵向和横向两个角度研究了数字经济的发展对我国居民消费结构及福利水平的影响。服务型消费在经济增长中的贡献率逐步提升,尤其是在文化、健康、信息等领域,消费增长迅速,呈现出两位数的增长态势,毛中根[2]在文章中指出,我国服务型消费处在快速发展阶段,随着人均GDP增长逐步上升为居民主导性消费,其中,教育、医疗、文化、信息等方面的支出增长尤为显著。同时,绿色消费等新型消费亮点也备受瞩目。党的二十大报告提出,要倡导绿色消费,推动形成绿色低碳的生产方式和生活方式,让绿色低碳理念渗透进人们的日常生活。同时,从我国居民人均消费支出的变化来看,近年来也有较大幅度的提升。随着互联网技术的快速发展,线上消费在中国市场迅速崛起,电子商务平台为消费者提供了更加便捷、多样的购物体验,同时也为商家提供了更广阔的市场空间,线上消费不仅改变了消费者的购物习惯,也推动了传统产业的转型升级。在消费升级的背景下,消费者对于个性化、定制化的产品和服务的需求也在不断增加,他们追求独特的消费体验和生活方式,希望获得符合自己个性和需求的产品和服务。企业和商家需要更加关注消费者的个性化需求,提供定制化的产品和服务来满足他们的需求。为了促进消费市场的健康发展和消费结构的优化升级,中国政府也出台了一系列消费政策进行引导。

本文运用因子分析方法,对中国2022年31个主要城市的八个影响消费结构的指标进行了重新组合,提取了三个公共因子。同时,通过系统聚类法,成功地将这31个城市划分为三类,这一分类结果有助于提出更具针对性的解决方案。总的来看,近年来我国的消费结构正在由物质型消费向服务型消费转变,消费结构不断升级和优化。然而,也需要注意到消费结构升级面临的压力和挑战,需要进一步推动结构性政策调整和机构性改革,以促进消费结构的持续优化和升级。

2. 分析方法与文献

2.1. 因子分析

因子分析是一种多变量统计分析方法,它通过研究多个变量之间的内部依赖关系,找出潜在的不可观察的公共因子,并用这些公共因子来解释原始变量之间的相关性。这种方法旨在用较少数的因子来描述许多变量或观测值之间的联系,从而简化数据结构,便于后续的分析和解释。因子分析在多个学科领域都有广泛的应用,周志衡[3]等基于因子分析方法,构建了一个中国成人主动健康素养评估体系,具有较高的科学和实用性;胡涛[4]运用因子分析方法,研究影响信阳市大学生体育消费行为的因素。

因子分析的优势在于能够通过降维技术简化数据结构,发现变量间的潜在关系,为决策提供科学依据。然而,该方法也存在一定局限性,如对于样本量小、变量间相关性不强的情况,因子分析的结果可能不够稳定,此外,因子的解释和命名也需要依赖于研究者的专业知识和经验。在应用因子分析时,首先需要对原始数据进行预处理,如缺失值处理、异常值处理等。接着,通过计算相关系数矩阵或协方差矩阵,采用适当的提取方法(如主成分分析、最大似然法等)提取公共因子。然后,通过旋转(如方差最大化旋转)使因子载荷矩阵更具解释性。最后,根据旋转后的因子载荷矩阵解释因子的含义,并计算每个观测值在各个因子上的得分。在应用因子分析后,我们需要对分析结果进行评价,以确保其准确性和有效性,常用的评价指标包括因子载荷矩阵的合理性、因子的解释性等。如果发现分析结果不理想,可以通过调整数据处理方法、更换提取方法或优化旋转策略等方式进行优化。此外,还可以通过与其他分析方法相结合,如聚类分析、回归分析等,进一步提高分析效果。龚丽贞和徐培毓[5]基于因子分析和聚类分析对我国食品行业上市公司财务绩效进行分析,针对不同类型公司提出不同的发展建议;谢颖[6]等基于因子分析和聚类分析研究800例斑秃患儿的中医证候。

随着大数据和人工智能技术的快速发展,因子分析在未来的应用前景将更加广阔。未来,因子分析可能会与深度学习、自然语言处理等先进技术相结合,为更复杂的实际问题提供解决方案。同时,随着计算能力的提升和方法的不断改进,因子分析在处理大规模数据集和高维变量时也将更加高效和准确。

2.2. 聚类分析

聚类分析是一种无监督学习方法,旨在将数据集中的对象按照其相似性进行分组,使得同一组内的对象尽可能相似,而不同组的对象尽可能不同。通过聚类分析,我们可以发现数据中的潜在结构和模式,为后续的数据分析和决策提供有力支持。聚类分析在多个领域都有广泛的应用,例如,王量量[7]等基于聚类分析将闽西客家传统村落文化景观分为三类,奠定客家文化景观保护的基础;李树平[8]等利用K均值聚类算法研究我国城市年用水量。

在进行聚类分析之前,通常需要对数据进行预处理以提高聚类效果,常见的预处理方法包括数据清洗、特征选择、特征提取、数据标准化等。常见聚类算法有K-means算法、层次聚类算、DBSCAN算法、谱聚类算法等。

聚类分析作为一种重要的无监督学习方法,在未来的发展中将面临更多的挑战和机遇,通过不断研究和创新,我们相信聚类分析将在各个领域发挥更大的作用并为人类社会的发展做出重要贡献。

3. 实证分析

3.1. 数据来源

Table 1. Variable names

1. 变量名称

变量名称

x1:食物烟酒

x5:交通通信

x2:衣着

x6:教育文化娱乐

x3:居住

x7:医疗保建

x4:生活用品及服务

x8:其他用品和服务

本文选择中国统计年鉴提供的2022年全国各地区人均消费支出的8项数据为例进行分析,变量名称见表1

3.2. 全国消费结构的因子分析

1) 结构效度分析

表2结果分析可知,KMO值为0.811,表明量表数据中测量指标准确程度较准确,说明效度可接受。巴特利特球形度检验的显著性小于0.01,可以否定相关矩阵为单位阵的假设,即认为各变量存在显著的相关性。

Table 2. KMO and Bartlett’s test

2. KMO和巴特利特检验

KMO取样适切性量数

0.811

Bartlett的球形度检验

上次读取的卡方

241.893

自由度

28

显著性

0.000

2) 碎石图

初步判断:通过图1碎石图可以看出主成分可以选取前三个或前四个。

Figure 1. Crushed stone map

1. 碎石图

3) 计算公因子方差

公因子方差表示变量的共同度,如表3所示,除医疗保健外,其它各影响因素的共同度都在85%以上,表明抽取的主成分能够很好地解释原变量,并且可以从各个因素中抽取出各个变量,从而进行因素分析。

Table 3. Common factor variance

3. 公因子方差

影响因素

初始值

提取

食物烟酒

1.000

0.923

衣着

1.000

0.886

居住

1.000

0.892

续表

生活用品及服务

1.000

0.929

交通通信

1.000

0.909

教育文化娱乐

1.000

0.944

医疗保健

1.000

0.768

其他用品及服务

1.000

0.887

4) 总方差解释

表4可知,前三个主成分的累计贡献率达到89.231%,因此,可以取前面三个主成分,然后根据成分得分判断主要影响因素。

Table 4. Explanation of total variance

4. 总方差解释


初始特征值

提取载荷平方和

成分

总计

方差百分比

累积%

总计

方差百分比

累积%

1

5.670

70.878

70.878

5.670

70.878

70.878

2

0.914

11.425

82.304

0.914

11.425

82.304

3

0.554

6.927

89.231

0.554

6.927

89.231

4

0.356

4.451

93.681




5

0.281

3.514

97.195




6

0.102

1.279

98.474




7

0.067

0.835

99.309




8

0.055

0.691

100.000




5) 成分得分矩阵

表5可以看出,第一因子主要集中在生活用品及服务,其他用品及服务,居住,交通通信,第二个因子只在食物烟酒有较高的得分,第三个因子主要集中在教育文化娱乐。从提供的信息中,我们可以得知三个因子在我国城镇居民消费中的地位逐渐减弱。这种趋势反映了我国城镇居民消费模式的转变。这种转变不仅反映了我国经济的发展和人民生活水平的提高,也体现了人们消费观念的升级和生活方式的多样化。

Table 5. Composition matrix

5. 成分矩阵


成分


1

2

3

食物烟酒

0.600

0.740

0.126

衣着

0.826

−0.174

−0.417

居住

0.911

0.212

0.132

生活用品及服务

0.950

−0.163

0.013

交通通信

0.893

−0.330

0.050

教育文化娱乐

0.763

−0.293

0.525

医疗保健

0.828

0.261

−0.117

其他用品及服务

0.912

−0.040

−0.233

6) 各省市的因子得分

Table 6. Factor scores

6. 因子得分

地区

因子1

因子2

因子3

综合

北京

2.22415

−1.0852

0.40506

1.54401

天津

1.19911

−0.15149

−0.12372

0.9239

河北

−0.30158

0.43038

−0.2608

−0.132

山西

−1.05773

0.03285

0.1554

−0.86948

内蒙古

−0.11727

1.35549

−0.61052

0.6277

辽宁

0.11371

−0.24491

0.00734

−0.12386

吉林

−0.66597

0.14627

0.00124

−0.51846

黑龙江

−1.10097

−0.23177

0.12149

−1.21125

上海

2.73309

−1.40051

0.16843

1.50101

江苏

0.74241

0.07914

−0.34955

0.472

浙江

1.8251

0.64485

−0.64626

1.82369

安徽

−0.8984

−0.04105

−0.28787

−1.22732

福建

0.3531

−0.85218

−0.37009

−0.86917

江西

−1.03274

−0.50006

−0.08218

−1.61498

山东

0.56193

1.18593

−0.34223

1.40563

河南

−0.89913

0.26357

−0.21959

−0.85515

湖北

−0.89421

−0.39678

−0.07899

−1.36998

湖南

0.34031

2.00005

4.84785

7.18821

广东

1.05212

−1.01859

−0.3392

−0.30567

广西

−1.35045

−1.71923

0.40708

−2.6626

海南

−0.85968

−2.60198

0.88873

−2.57293

重庆

0.39727

0.49713

−0.21886

0.67554

四川

−0.01993

−0.13598

−0.19912

−0.35503

贵州

−0.97135

−0.0339

−0.22434

−1.22959

云南

−0.21488

−0.34022

0.11699

−0.43811

西藏

0.21205

2.11079

−1.60316

0.71968

陕西

−0.41956

−0.04469

0.19147

−0.27278

甘肃

−0.33053

1.28198

−0.99841

−0.04696

青海

−0.01753

0.30622

−0.08409

0.2046

宁夏

−0.34423

0.54598

−0.17464

0.02711

新疆

−0.2582

−0.08208

−0.09747

−0.43775

根据表6可以看出,第一因子得分前五名的地区分别为:上海,北京,浙江,天津,广东,这些城市的居民对基本生活要求较高,所以对这方面的支出较多。第二因子得分前五名的地区分别为:西藏,湖南,内蒙古,甘肃,山东。这些城市人口在全国居领先地位,对食物烟酒等支出较多。第三因子得分前五名的省市分别为:湖南,海南,广西,北京,陕西,这些城市在享受消费的支出居全国领先地位,对教育文化娱乐等支出较多。综合得分排名前五位是湖南,浙江,北京,上海,山东。综合排名第一的是湖南,查阅相关资料可知,近几年,湖南省的经济增长保持了稳定且健康的态势。湖南省依托其独特的地理位置和资源优势,积极推动区域经济发展,实现了经济的稳步增长。湖南省的GDP增长率持续保持在全国前列,为湖南的未来发展奠定了坚实的基础。随着居民收入的提高和消费观念的转变,湖南的消费市场呈现出多元化、个性化的特点。传统消费品市场保持稳定增长,同时,新兴消费品市场如电子商务、跨境电商等也发展迅速。在消费结构上,湖南省正经历着显著的变化。传统的吃穿用等生活必需品消费占比逐渐下降,而教育、文化、旅游等服务性消费占比逐年上升。此外,绿色健康消费等新型消费模式也在湖南逐渐兴起,成为消费市场的新增长点。综合得分排名后五位的依次是贵州,湖北,江西,海南,广西,经济环境是影响消费能力的重要因素,如果经济增速放缓,就业市场困难人们的收入可能会受到影响,导致消费能力下降。

3.3. 聚类分析

对上述数据利用离差平方和法进行聚类的树形图如图2所示:

Figure 2. Clustering

2. 聚类

从实际情况出发,以横线所在位置作为阈值,将城市分为三类:

第一类:北京,上海,天津,浙江,广东,江苏,福建。

第二类:陕西,河南,吉林,山西,黑龙江,贵州,安徽,江西,湖北,广西,海南。

第三类:湖南,西藏,甘肃,内蒙古,河北,辽宁,新疆,青海,宁夏,云南,山东,重庆,四川。

4. 结论与建议

不同城市的消费结构可能会存在显著的差异,这主要受到城市的经济水平、文化背景、人口结构、政策导向等多种因素的影响。第一类城市的消费结构往往更为多元化和高端化,因为这些城市的经济发展水平高,人均可支配收入多,消费者对高品质商品和服务的需求强烈,这些城市的消费结构可能更偏向于高端消费品、教育、医疗、娱乐等服务,同时,这些城市的消费者也更注重品牌、品质和体验。相比之下,第二、三类的消费结构可能更加偏向于日常生活用品、基本服务等,消费者对价格更加敏感,消费决策可能更加受到实际需求和性价比的影响。因此,不同城市的消费结构呈现出多样化的特点,这反映了各城市独特的经济、文化和社会背景,同时,随着城市的发展和变化,消费结构也会随之调整和优化。消费市场也面临许多挑战,首先是收入差距大,虽然总体消费水平在提高,但不同人群之间的收入差距较大,这影响了消费结构的优化和升级,其次是消费环境有待改善,在一些领域,如网络购物、售后服务等,还存在诚信缺失、质量问题等,这影响了消费者的信心和意愿。

为了应对消费结构变化及挑战,我们应从以下几个方面着手:第一,调整收入分配格局,通过税收、社保等手段,增加低收入人群的收入,缩小贫富差距,提高整体消费水平;第二,鼓励多元化消费,政府可以通过税收政策和财政扶持来鼓励居民进行多元化消费,如减少高档消费品的进口关税,降低豪华商品的消费税率,提高中低档商品的质量等;第三引导消费观念转变,通过宣传教育、媒体渠道等方式,引导居民转变消费观念,鼓励适度消费,增加对文化、旅游等非物质性消费的需求;第四,推动消费结构升级,政府可以加大对科技创新和服务业发展的支持力度,鼓励企业提供具有创新性和差异化特点的产品和服务,从而推动消费结构的升级;第五,改善消费环境,加强对市场的监管,打击假冒伪劣、虚假宣传等行为,提高消费者的权益保护意识。同时,加强消费者教育,提高消费者的消费知识和技能。总之,中国消费结构的优化和升级需要政府、企业和消费者共同努力。政府应加大对消费市场的支持和引导力度,企业应提高产品和服务的质量和创新性,消费者应提高消费素养并且理性消费。

参考文献

[1] 李晓钟, 韩本登. 数字经济、消费结构与居民福利[J]. 统计与决策, 2023, 39(22): 11-17.
[2] 毛中根. 服务消费发展: 现状、比较及建议[J]. 人民论坛, 2023(18): 40-45.
[3] 周志衡, 何井华, 金大年, 等. 基于因子分析法的中国成人主动健康素养评估体系构建[J]. 中国初级卫生保健, 2023, 37(12): 21-23.
[4] 胡涛. 基于因子分析法的信阳市大学生体育消费行为影响因素研究[J]. 文体用品与科技, 2024(3): 32-34.
[5] 龚丽贞, 徐培毓. 我国食品行业上市公司财务绩效评价——基于因子分析和聚类分析[J]. 西昌学院学报(自然科学版), 2023, 37(4): 24-29.
[6] 谢颖, 王燕平, 庄明月, 等. 基于因子分析和聚类分析的800例斑秃患儿中医证候研究[J]. 中医杂志, 2024, 65(4): 388-394.
[7] 王量量, 向彦霖, 王元珍, 等. 基于聚类分析的闽西客家传统村落文化景观分区研究[J]. 小城镇建设, 2024, 42(1): 5-11.
[8] 李树平, 王莹莹, 唐之嵋, 等. 城市年用水量聚类分析[J]. 净水技术, 2023, 42(12): 176-182.