云南省烟草商业系统卷烟销量影响因素分析
Analysis on Influencing Factors of Cigarette Sales in Yunnan Tobacco Commercial System
DOI: 10.12677/SA.2021.105080, PDF, HTML, XML, 下载: 449  浏览: 899 
作者: 刘忠华:中国烟草总公司云南省公司,云南 昆明
关键词: 主成分分析多元线性回归卷烟销量影响因素Principal Component Analysis Multiple Linear Regression Cigarette Sales Influencing Factors
摘要: 本文以云南省烟草商业系统卷烟销量为研究对象,利用2008~2018年的数据,构建基于主成分分析和多元线性回归的统计模型,定量分析云南省地区生产总值、社会消费品零售总额、居民可支配收入、人口、单箱销售收入和税利等因素对卷烟销量的影响,为云南省卷烟经济调控提供决策依据。
Abstract: Taking the cigarette sales of Yunnan tobacco commercial system as the research object, using the data from 2008 to 2018, this paper constructs a statistical model based on principal component analysis and multiple linear regression to quantitatively analyze the impact of regional GDP, total retail sales of social consumer goods, residents’ disposable income, population, single box sales revenue and tax profit on cigarette sales in Yunnan Province. It provides decision-making basis for cigarette economic regulation in Yunnan Province.
文章引用:刘忠华. 云南省烟草商业系统卷烟销量影响因素分析[J]. 统计学与应用, 2021, 10(5): 778-786. https://doi.org/10.12677/SA.2021.105080

1. 引言

烟草业作为国民经济体系中的一个相对特殊的行业,从短期来看,它的发展对经济是有利的,但从长远来看,它对人民的健康和环境都会产生不利影响,进而造成经济发展的滞后,因此,烟草业受到政府的严格监督与控制。

烟草业是云南省的主要经济产业,早期卷烟产销量的稳定增长为云南省经济发展做出了巨大贡献,但2008年以来,如图1所示,云南省烟草商业系统卷烟销量增速整体出现放缓趋势,卷烟消费市场开始进入饱和阶段,同时人们注重健康的意识在逐渐增强,卷烟的需求量继而出现减少趋势,另外,我国2011年颁布了禁烟通知,也对卷烟销售产生了一定影响。在卷烟消费进入这样一个特殊阶段后,对其影响因素做定量分析有助于全省烟草业的稳定发展。

Figure 1. Curve: Change trend of cigarette sales in Yunnan tobacco commercial system from 2004 to 2018

图1. 2004~2018年云南省烟草商业系统卷烟销量变化趋势

2. 数据的选取与处理

2.1. 数据选取

卷烟销售量的影响因素来自于地区经济发展水平、相关政策、物价水平等方面,本文从以上角度出发,选取了云南省地区生产总值(简称:GDP)、第三产业增加值占GDP的比重、社会消费品零售总额、居民人均可支配收入、城镇居民人均可支配收入、农村居民家庭人均纯收入、居民消费价格指数、年末常住人口、城镇人口、乡村人口、单箱销售收入、单箱税利、烟草商业系统卷烟销量年度数据作为分析数据,数据来源为国家统计局、《中国烟草年鉴》和《云南年鉴》,样本区间为2008~2018年。

2.2. 数据处理

2.2.1. 定基期居民消费价格指数计算

由于与经济金额有关的时间序列数据包含了通货膨胀或紧缩的因素,而度量通货膨胀是居民消费价格指数的基本功能之一,根据国家统计局公布的云南省“居民消费价格指数(上年 = 100)”(简称:CPI (上年 = 100)),计算出以2008年为基期的居民消费价格指数:“居民消费价格指数(2008年 = 100)”(简称:CPI (2008年 = 100)),具体算法为:

2008年CPI (2008年 = 100) = 100,

2009年CPI (2008年 = 100) = 2009年CPI (上年 = 100),

2010年CPI (2008年 = 100) =2010年CPI (上年 = 100) × 2009年CPI (2008年 = 100)/100,

2011年CPI (2008年 = 100) = 2011年CPI (上年 = 100) × 2010年CPI (2008年 = 100)/100,

2012年CPI (2008年 = 100) = 2012年CPI (上年 = 100) × 2011年CPI (2008年 = 100)/100,

……(以此类推) [1]

这样,就得到了各年度具有可比性的通货膨胀度量指标。

2.2.2. 居民人均可支配收入缺失数据测算

国家统计局自2013年开始公布居民人均可支配收入,对于2008~2012年的居民人均可支配收入,本文通过相关指标测算得到,测算公式为:居民人均可支配收入 = 城镇人口/年末常住人口 × 城镇居民人均可支配收入 + 乡村人口/年末常住人口 × 农村居民家庭人均纯收入。

2.2.3. 单箱税利与销售利税率

为体现单箱税利与单箱销售收入的关系,将单箱税利指标替换为销售利税率,计算公式为:销售利税率 = 单箱税利/单箱销售收入。

2.2.4. 数据处理结果

数据处理完成后,选取的9项指标分别为:X1—GDP (亿元)、X2——第三产业增加值占GDP的比重(%)、X3——社会消费品零售总额(亿元)、X4——居民人均可支配收入(元)、X5——年末常住人口(万人)、X6——单箱销售收入(元)、X7——销售利税率(%)、X8——CPI (2008年 = 100)、Y——销量(万箱),各指标数据见表1

Table 1. Data on cigarette sales of tobacco commercial system in Yunnan Province and its influencing factors from 2008 to 2018

表1. 2008~2018年云南省烟草商业系统卷烟销量及其影响因素数据

3. 变量相关性

选定变量后,绘制各自变量的相关系数密度图,如图2所示,可以看出相关系数基本都在0.85以上,存在显著相关性,直接用这些数据做回归分析会出现多重共线性问题,且本文选用的数据样本量较少,而卷烟销量的影响因素较多,因此适合用主成分回归方法进行分析。

Figure 2. Curve: Correlation coefficient density diagram of independent variables

图2. 自变量相关系数密度图

4. 主成分回归

主成分回归可以用于解决多重共线性的问题,主要思路是:利用主成分分析方法得到互不相关的几个主成分,再用主成分与因变量建立多元线性回归模型,由于各主成分是标准化的原始变量的线性组合,可以将主成分还原为原始变量,最终就可得到因变量与各自变量的多元线性回归方程 [2] [3]。

4.1. 主成分分析

主成分分析结果如图3所示,可以得到各主成分与各标准化变量的关系表达式,例如,第一主成分:

F 1 = 0.362 Z X 1 + 0.354 Z X 2 + 0.35 Z X 3 + 0.363 Z X 4 + 0.363 Z X 5 + 0.352 Z X 6 + 0.324 Z X 7 + 0.358 Z X 8

其中, Z X n 为标准化的 X n ,标准化的规则为: Z X n = X n X ¯ n S X n ( n = 1 , 2 , , 8 ) X ¯ n 表示自变量 X n 的均值, S Xn 表示 X n 的标准差。

将标准化的原始变量带入主成分表达式,可以得到样本数据的各主成分得分情况,见表2

Figure 3. Curve: Importance of components and loadings

图3. 主成分贡献率与载荷

Table 2. Score of principal component

表2. 主成分得分表

4.2. 多元线性回归

为更好地拟合模型,避免有效信息的丢失,初步选取所有主成分得分与卷烟销量做多元线性回归,再根据显著性逐步剔除不显著的主成分,最终得到主成分回归结果,见图4

从主成分回归结果可以看出,回归模型调整后的决定系数为0.9803,拟合效果较好。常数项和主成分F1、F2、F3、F4、F5的t检验p值均小于显著性水平0.05,说明其对因变量的影响是显著的。F检验的p值小于显著性水平0.05,回归模型显著。

下面针对回归模型残差的正态性、独立性、同方差性以及模型的线性进行诊断:

多元线性回归的正态性假设认为:当预测变量值固定时,因变量呈正态分布,则残差值也应该是一个均值为0的正态分布。从图5学生化残差Q-Q图可以看出,所有点均在置信区间内,表明符合正态性假设。

使用Durbin-Watson检验函数检验残差的序列相关性,检验结果如图6所示,p值大于显著性水平0.05,不显著,说明误差项之间无自相关性,相互独立。

Figure 4. Curve: Result of principal components regression

图4. 主成分回归结果

Figure 5. Curve: Q-Q plot of studentized residual

图5. 学生化残差Q-Q图

Figure 6. Curve: Result of Durbin-Watson test

图6. Durbin-Watson检验结果

进一步通过NCV检验对模型残差的异方差性进行检验,NCV检验零假设为误差方差不变,备择假设为误差方差随着拟合值水平的变化而变化。检验结果如图7所示,p值为0.16454,大于显著性水平0.05,不能拒绝误差方差不变的假设,因此推断模型残差的方差是相同的。

Figure 7. Curve: Result of NCV test

图7. NCV检验结果

图8成分残差图可以看出,各主成分与卷烟销量满足线性假设,线性模型对本次分析是适合的。

Figure 8. Curve: Component and residual plots

图8. 成分残差图

最终可以确定云南省烟草商业系统卷烟销量与各主成分的回归模型为:

Y = 169.8209 + 2.671 F 1 + 2.3975 F 2 8.3051 F 3 + 4.4242 F 4 30.3223 F 5

将主成分还原为标准化的原始变量,得到模型表达式为:

Y = 169.8209 10.6226 Z X 1 + 2.2708 Z X 2 + 7.0546 Z X 3 14.8145 Z X 4 + 9.1519 Z X 5 + 22.4749 Z X 6 0.7089 Z X 7 6.6527 Z X 8

最后把标准化的原始变量转化为原始变量,可以得到烟草商业系统卷烟销量与各原始变量的回归方程:

Y = 284.8592 0.0023 X 1 + 0.6202 X 2 + 0.0034 X 3 0.0034 X 4 + 0.1014 X 5 + 0.0041 X 6 0.3079 X 7 0.7487 X 8

根据最终的主成分回归模型,得到拟合值与真实值的对比图如图9所示,可以看出,模型拟合值和实际销量的整体趋势是一致的。

5. 模型结果分析

从最终的回归方程可以看出:

常数项为负,当各项指标都为零时,模型拟合结果为负值,表明这种极端情况是不足以支撑云南省烟草商业系统产生卷烟销量的,当各项指标增长到一定程度后,卷烟销量才开始为正。

X1 GDP (亿元)的系数为负,表示卷烟销量随云南省地区生产总值的增加而减少,从实际情况来看,2008~2018年云南省烟草商业系统卷烟销量没有呈现持续增长的状态,说明市场需求量已基本饱和,而地区生产总值随经济发展在不断增加,卷烟所带来的经济发展在地区生产总值中的比重在不断减少。其他条件不变的情况下,云南省地区生产总值每增加1亿元,卷烟年销量减少23箱。

Figure 9. Curve: Fitting result

图9. 拟合效果图

X2第三产业增加值占GDP的比重(%)、X3社会消费品零售总额(亿元)、X5年末常住人口(万人)的系数为正,解释为随着第三产业增加值占GDP的比重、社会消费品零售总额、年末常住人口的增加,云南省烟草商业系统卷烟销量也不断增加,例如,其他自变量不变的情况下,年末常住人口每增加1万人,卷烟年销量增加1014箱。

X4居民人均可支配收入(元)的系数为负,表明一方面当人均卷烟需求量达到饱和时,就不会再随着收入的增加而增加,另一方面收入不断增加的同时人民的健康意识也在增强,更多的消费选择导致卷烟购买量的减少。其他条件不变的情况下,居民人均可支配收入每增加1元,卷烟年销量减少34箱。

X6单箱销售收入(元)的系数为正,X7销售利税率(%)的系数为负,可以理解为人们对价位较高的高端卷烟有更多的选择倾向,但同时销售利税率又在抑制人们的这种消费倾向,提高税负是有效的控烟措施。其他条件不变的情况下,单箱销售收入每增加1元,卷烟年销量增加41箱,销售利税率每增加1%,卷烟年销量减少3079箱。

X8 CPI (2008年 = 100)的系数为负,表示卷烟销量随着定基期CPI的增加而减少,CPI代表了通货膨胀程度,通货膨胀程度越高,收入不变的情况下,人们的购买力是越低的,卷烟的销量也就随之降低。其他自变量不变的情况下,CPI (2008年 = 100)每增加1,卷烟年销量就减少7487箱。

结合以上模型解释,从以下三方面分析影响卷烟销量的影响因素:

第一,社会经济因素。人口、产业结构、社会消费和通货膨胀都不同程度上影响或体现卷烟销量的变化,随着人口、第三产业增加值占地区生产总值的比重和社会消费的增加,卷烟销量将会随之增加,但在卷烟市场相对饱和、产业多样化发展的实际情况下,地区生产总值的不断增加已不再体现、带动卷烟销量的增加。而通货膨胀则通过影响购买力进而抑制卷烟销量。

第二,人民健康因素。近年来健康、绿色、环保的理念深入人心,人们对卷烟的危害有了更多的关注,同时更健康安全的卷烟替代品市场在逐渐形成并扩张,卷烟市场受到了一定程度的冲击。

第三,政策法规因素。政府通过政策法规对卷烟销售利税实现监督与控制,销售利税的增加进而对卷烟销量产生抑制作用,卷烟利税的提高是有效的控烟政策。

参考文献

[1] 都恩环, 雷海潮. 提高烟草税对我国卷烟消费影响的实证研究[J]. 中国卫生经济, 2020, 39(6): 66.
[2] 赵颖. 基于回归分析的我国汽车销量预测模型研究[D]: [硕士学位论文]. 武汉: 华中师范大学, 2014: 29-38.
[3] 李莹. 基于时间序列与多元线性回归综合模型的农村卷烟销量预测[D]: [硕士学位论文]. 昆明: 云南大学, 2015: 33-40.