1. 引言
续保率一定程度上反映了保险公司业务稳定程度和对客户的保留能力,其成为汽车保险行业评估保险公司市场份额的决定性因素。实际上,续保率由保费浮动等度量,给出一套较为合理的保费浮动方案已成为保险公司提高续保率的重要依据。目前为止,已经对续保率影响因素从不同角度有了研究。陈曼发现在众多不同种类车辆中家庭自用车的续保率最低 [1] [2] [3]。刘亮利用K-means聚类算法将客户划分为某几类,并用多元回归分析得到每一类客户的主要影响因素进行了对比 [4]。王梦晨选择广义线性模型中的logistic模型为工具从多个层面分析了车险业务中影响续保率的因素 [5]。本文在此基础上,收集相关部门数据,综合考虑了各方面因素的影响,建立了影响力指数的等级比较模型,利用灰色预测法进行灰色关联度预测。进而根据“保费浮动系数 = 索赔系数A × 使用性质系数B”这一模型,提出了较为合理的保费浮动方案。最后建立决策树模型,判断方案可行性。
2. 建立等级比较模型
首先,从原始表格中提取出“承包车辆的使用性质”,“承包车辆的出现次数”、“承包车辆的年龄”和“承包车辆的新车购买价”这四个具有代表性的市场因素,使用7个月份的数据(来源:中国统计局),建立新的数据表格,进行基础数据处理后,建立图1。
选取前四个月的续保率数据来进行研究,这样就避免了研究全部7个月份时由于前四个月与后三个月的数据变化较大而造成的误差。提取“承包车辆的出现次数”、“承包车辆的新车购买价”、“承包车辆的使用性质”和“承包车辆的年龄”这四个代表性因素的9、10、11、12四个月份的数据,根据方差公式
![](//html.hanspub.org/file/34-2621718x11_hanspub.png?20210728081205732)
![](//html.hanspub.org/file/34-2621718x10_hanspub.png?20210728081205732)
![](//html.hanspub.org/file/34-2621718x13_hanspub.png?20210728081205732)
![](//html.hanspub.org/file/34-2621718x12_hanspub.png?20210728081205732)
Figure 1. The effect of different factors on renewal rate in seven months
图1. 7个月份中不同因素对续保率的影响图
,
得到各个市场因素9、10、11、12月份的四个方差,进而得到影响力评估指数 [4] [5] [6]
。
将保险业市场因素对该企业续保率的影响力评估指数分为A、B、C、D、E五个等级比较模型,得到表1。
![](Images/Table_Tmp.jpg)
Table 1. Grade comparison model of influence evaluation index
表1. 影响力评估指数的等级比较模型
将四个因素对续保率的影响力评估指标数据带入等级比较模型,获得每个因素的代表等级,得到表2。
![](Images/Table_Tmp.jpg)
Table 2. Table of factors influence evaluation index and grade
表2. 各个因素影响力评估指数与影响力等级对应表
3. 续保率的灰色预测模型
从2016年9月至2017年3月七个月的到期车辆续保率的原始数据,得表3。
![](Images/Table_Tmp.jpg)
Table 3. Renewal rate of family car
表3. 家庭自用车续保率
通过计算(见附录),可知GM(1,1)模型的参数
,
,即其微分方程为 [7] [8]:
。
GM(1,1)灰色微分方程时间响应序列为
。
其中
的模拟值为
由
,还原出
的模拟值得:
进而计算
与
的灰色关联度
以及其相对误差
。
根据得到的结果对比精度检验等级参照表可知(附录),一级精度的家庭自用这一使用性质对续保率有很显著的影响。
同样的方法,分别对以下几种车应用灰色预测法进行精度检验,得到表4。
![](Images/Table_Tmp.jpg)
Table 4. Table of grey relational degree of using properties and renewal rate
表4. 使用性质与续保率灰色关联度列表
结果表明,灰色关联度分别是党政机关客车为、企业客车为、非营业货车为、出租租赁为、营业货车为、特种车为,都大于0.9,所以它们的续保率的精度都为一级,这也即是证明车辆使用性质这一因素会明显影响公司的续保率。
4. 保费浮动方案
首先把商车险和交强险分开,分别统计两个险别中各类车的使用的投保辆数、赔付赔付款总额、出险车辆数、浮动前保费总额、总的车辆数。其中在这两种险别中,特种车很少发生事故,所占的比例小,可以不考虑。统计结果得到表5。
![](Images/Table_Tmp.jpg)
Table 5. Statistics table of commercial and compulsory insurance
表5. 保户投保商车险和交强险的投保车辆数统计表
其中百分比是该种车辆数占商车险或交强险总投保车辆的比例,在两个险别中城市公交与特种车投保车辆都非常少,故不予以考虑。若投保客户的投保额小,但客户发生事故的次数多,那总赔付款与出险次数成正比,公司的盈利与出险次数成反比。下面根据车辆使用性质的不同,统计出两个险别的其他参数数据。得到表6和表7。
![](Images/Table_Tmp.jpg)
Table 6. The data of commercial insurance
表6. 商车险数据统计表
![](Images/Table_Tmp.jpg)
Table 7. The data of compulsory insurance
表7. 交强险数据统计表
由以上数据可以计算出:
根据以上三种比例可得到三种方案(i = 1表示商车险,i = 2表示交强险):
方案一:浮动后保额 = (1 − Ai)浮动前保额
方案二:浮动后保额 = (1 − Bi)浮动前保额
方案三:浮动后保额 = (1 − Ci)浮动前保额
代入数据结果如表8。
![](Images/Table_Tmp.jpg)
Table 8. The programme of commercial and compulsory insurance
表8. 商车险和交强险方案统计表
方案一根据出险车辆数的比例提出的,只考虑了所投保的车辆是否会发生事故,却没考虑其他因素,例如公司的保户个数、总保费、赔付款总额。该方案考虑的并不全面,所以不能广泛推广,作为辅助参考一下。
方案二的提出是根据出险车辆赔付款占浮动前保费总额比例,充分考虑了各个因素,因而具有普适性,推荐采用此方案。
方案三以保险公司的利益为基本,考虑了赔付款对投保车辆浮动前保费总额的占比,但是没有考虑到出险的车辆数。如果一个公司在这一年利益不错的情况下,但是如果处理客户出险事故的次数太多的话,就会造成人力资源在该业务倾斜从而被浪费,由此可以看出这个方案有一定的局限性。
因此方案二更可行。
根据索赔系数A与使用性质系数B,结合模型 [9] [10],得到最终的保费浮动系数方案表9。
![](Images/Table_Tmp.jpg)
Table 9. The final programme of floating premium
表9. 最终的保费浮动方案
5. 建立决策树
决策树是一种树形结构,上面的每一个节点就代表对其属性上的一个判断,树上的每个分支就是一个判断结果的输出。用决策树方法来评价一个项目的风险,易于理解,结果更加直观,更容易解释方案是否可行 [11] [12]。根据 [13] [14]
,
对使用性质不同的车辆进行以下赋权值:
同时,再对纯收入、风险投保以及拖延理赔赋权值:
经过分析得到决策树模型如图2所示。
![](//html.hanspub.org/file/34-2621718x45_hanspub.png?20210728081205732)
Figure 2. The analysis chart of decision tree
图2. 决策树分析图
已知方案的期望收益就是把未来收益各种可能结果出现的概率对了解到的估计值做加权平均。分公司得分
,其中A、C、D的上极限为1,将上极限值带入公式得到270,可以得到总公司对分公司的风险评估分数区间为(0, 270),根据公司评价表(见附录)可知,参考数据中的汽车保险公司一般 [15]。
6. 结束语
随着科技的发展汽车使用率只增不减,越来越多的人关注汽车保险,其在保险行业的地位与日俱增,合理的评估续保率,对于保险公司有具有重大意义。通过选取重要影响因素,本文建立影响力指数的等级比较模型,说明了各因素对续保率的影响。而后利用灰色预测法进行灰色关联度预测,计算出使用性质系数B,并得到三种使用性质系数B的方案,经分析第二种方案更加合理。最后,通过三个因子赋权值构建决策树模型,数据结果表明,该方案具有合理性,值得推广。
基金项目
海南省自然科学基金(120RC451),国家自然科学基金(11761025, 11961018, 11901114),广东省教育厅青年创新人才类(2017KQNCX081),广州市科技创新一般项目(201904010010),中山大学广东省计算科学重点实验室开放课题基金资助(2018001),海南省研究生创新科研课题项目(Hys2020-108)。
附录
1:对家庭自用车对续保率的影响进行灰色预测
家庭自用车续保率表
1) 建立原始序列
由于原始数据序列
为非负序列,则
其中,
由表格可知,时间序列
有7个观察值,即2010年9月至2011年3月,用1到7代表,则
2) 对
作1-AGO
D为
的通过累加生成新数据序列为
则GM(1, 1)模型相应的微分方程为:
其中
,
是模型的参数。
3) 对
作紧邻均值生成,令
于是,
设
为待估参数向量,
,可利用最小二乘法求解。解得:
4) 确定模型
因此,GM(1,1)模型的参数
,则其微分方程为:
GM(1,1)灰色微分方程的时间响应序列为
5) 求
的模拟值
还原出
的模拟值,由
得
6) 误差检验
![](Images/Table_Tmp.jpg)
Table A1. Table of residual test
附表A1. 残差检验表
残差平方和
平均相对误差
计算
与
的灰色关联度
![](Images/Table_Tmp.jpg)
Table A2. Referenced table of the precision test ranks
附表A2. 精度检验等级参照表
![](Images/Table_Tmp.jpg)
Table A3. Table of company evaluation
附表A3. 公司评价表
NOTES
*通讯作者。