1. 引言
近年来,随着市场经济的发展,企业间竞争加剧,企业为了扩大市场份额和减少库存压力而越来越多地运用商业信用。商业信用是企业在销售产品时为客户提供一定延迟付款期限而产生的一种赊销模式 [1] [2] 。商业信用可以增加企业的客户黏性、扩大销售规模、降低销售成本,在激烈的市场竞争中扩大竞争优势,是企业一项重要的经营战略,是商业活动中一项非常常见的方式 [3] 。应收账款是商业信用的直接产物,它是指在收到现金付款之前向客户交付商品或提供服务,伴随企业的销售行为发生而形成的一项债权。由于应收账款是企业在销售过程中被购买单位所占用的资金,因此,从企业投资和流动资金的角度来看,应收账款既是企业投资的一个重要方面,也是流动资金中的一个重要项目 [4] 。
在激烈的市场竞争环境下,应收账款是加大市场占有率,提高竞争力的一种重要手段,并且应收账款可以作为降价和规避价格限制措施的替代手段,以避免引发激烈的价格战,因此,适度提供应收账款也是一种通过建立商誉来提升企业形象的有效方法 [5] [6] 。随着企业生产规模扩大,客户数量不断增加,应收账款金额也逐渐增长。一方面,应收账款增加可以提高企业的销售额和盈利能力;另一方面,由于应收账款的增加并不能增加企业的实际现金流入,反而迫使企业运用有限的流动资金来支付各项费用,加速现金流出,并且当应收账款达到巨额时,将对企业的资金周转和管理成本造成更加沉重的负担 [7] [8] [9] [10] 。因此,对应收账款的回款时间进行预测显得尤为重要,准确的回款时间预测可以帮助企业合理安排资金使用,降低财务风险,维持运营的平稳性。此外,企业根据预测结果可以综合考虑未来现金流变化和资金需求,这对企业进行科学的应收账款管理、更好地分配企业资源、保证良性经营发展、稳定资金链、确保现金流充裕等方面具有重要的意义。
当前,企业在应收账款管理中普遍采取统一的措施,无论客户是否按时支付应收账款,都会在到期日前按固定时间表与客户联系,未能区分不同客户的支付行为特点,也未收集客户支付行为数据进行系统化分析,没有对客户的重复性支付模式和偶发性支付问题进行区分,例如,客户偶尔面临的财务问题而没按照之前的习惯付款,导致对客户的历史信息无法有效利用 [11] 。基于现有研究的不足,本文以某企业历史应收账款的真实数据为研究对象,分析客户的支付行为特点,对客户进行分类,针对不同类型的客户采用不同的模型进行预测研究。
2. 研究设计
2.1. 样本选择与数据来源
本文的样本数据来源于D企业2020年1月至2023年3月期间应收账款的39万余条真实数据,为保护企业和客户隐私,样本数据进行了脱敏处理,不涉及真实客户信息。样本数据包含的各指标定义见表1。
2.2. 数据预处理
由于原始样本数据自身特征不够明显,不足以捕捉客户的关键信息和回款规律,因此需要进行特征工程,以提炼出更有预测价值的特征。本研究对样本数据进行的主要特征工程和处理包括以下几点。
2.2.1. 归一化数据类型
原始样本数据中的金额存在不同的币种,为了消除币种影响,需要进行数据规范化,将所有金额统一转换为同一币种。
2.2.2. 结构化数据特征
原始样本数据中,回款时间信息隐藏在不同类型的订单记录中,不够明确。需要通过匹配凭证类型为应收账款和回款两种类型的订单记录,构建一个回款时间的特征字段Received Date,直接反映客户的实际回款时间。
2.2.3. 数据清洗
1) 数据去重。根据凭证编号唯一的特性,对数据进行去重,避免同一订单被重复统计,保证后续分析的正确性;
2) 处理缺失值。考虑到有充足的样本量,删除部分数据不会对模型训练造成较大影响,因此,对回款时间缺失的数据采取直接删除法,以保证样本数据的真实性和完整性。
2.2.4. 派生数据新特征
1) 回款周期(AR Collection Days)。是指企业对客户的应收账款从形成到实际收回的整个时间间隔,即开票日期到回款日期的时间间隔。它直观反映了每笔应收账款的回收速度。
2) 账期(Payment Term)。是指企业提供给客户的支付期限,即开票日期到截止日期的时间间隔。账期的长短在一定程度上反映企业对客户的信任程度,账期越长,通常意味着企业对该客户的信任程度越高,允许的信用期限越长。
3) 逾期天数(Received vs. Due)。是指客户实际回款日期与截止日期的时间差。如果差值大于0,表示回款延迟,属于逾期回款;差值小于或等于0,表示回款准时,属于未逾期回款。逾期天数反映了客户的回款履约情况,可以用来评估应收账款的回款风险和客户的信用水平。
4) 回款间隔(Received Interval Days)。是指同一客户的多笔回款日期按时间顺序排列,每两笔回款日期之间的时间间距,可以反映客户回款的频率。
5) 回款星期值(Received weekday)。是指回款日期对应到的星期几,以此反映客户有无固定在星期几回款的情况。
6) 截止日期类型(Due Date Holiday Tag)。是指截止日期当天是工作日还是节假日,以反映客户在工作日和节假日的回款差异。
7) 回款周序数(Received Week of Month)。是指回款日期在所属月份的周序数,可以表示为该月的正序第几周和倒序第几周,用以反映客户有固定回款的周序数。
3. 实证分析及结果
客户回款行为可以分为三类:第一类是具有个体回款习惯的客户,这部分客户由于自身企业的财务制度表现出有固定的回款日期和回款间隔时间的特点;第二类是依赖截止日期的客户,这类客户的共同特征是回款日期与截止日期高度相关,其原因大多是订单金额较大从而签订了严格的合同条款;第三类是无规律回款的客户,这类客户由于订单金额不是很大企业对其合同约束相对较为宽松,部分客户与企业也没有长期的合作关系,因此没有明确的回款规律,而这一类客户的数量以及应收账款金额的占比较高,不容忽视。
3.1. 模型选择与构建
为准确预测不同类型客户的回款时间,本文基于上述三种类型的客户,分别建立了不同的预测模型:对于具有个体回款习惯类型的客户,利用其历史回款规律进行定性预测;对于依赖截止日期类型的客户,建立回款日期与截止日期之间的回归模型;而对于无规律类型的客户,采用概率模型来描述其回款时间的随机性,进而用蒙特卡洛模拟。研究发现,通过这种针对不同客户类型分别定制的预测模型方法,可以显著提高不同类型客户回款时间的预测精确度。
3.1.1. 个体回款习惯类型
由于具有个体回款习惯类型的客户根据其历史回款数据总结出个体的回款规律,这类客户的应收账款适合采用定性预测的方式进行实证研究,该模型的优势在于能够充分利用客户的历史数据,针对其回款习惯做出有效、准确的预测。由于回款日期集中度与回款周期两个维度的标签各有一个即可确定一个回款日期,因此,根据表2对该类型客户的预测方式,可以较准确的锁定其下一次回款时间。
![](Images/Table_Tmp.jpg)
Table 2. Individual repayment habits customer repayment time prediction method
表2. 个体回款习惯客户回款时间预测方式
其中,T为预测回款日期,D为订单开票日期,M为平均回款周期天数,F表示选择在日期
(或
)所在月份的固定回款日期,W表示在日期
(或
)所在周的固定回款星期值,P表示日期
(或
)所在月份的固定周序数(如第二周),R表示从锁定周中随机选择一天。
3.1.2. 依赖截止日期类型
依赖截止日期类型客户的显著特征是:订单的截止日期是影响客户回款时间的主要因素,为准确预测这类客户的回款日期,本文建立截止日期与回款日期之间的线性回归模型,设订单截止日期为自变量x,客户回款日期为因变量Y,各客户回款预测模型的一般形式为:
其中,
为预测月依赖截止日期类型客户数量,
和
分别表示第i个客户的回款日期和截止日期,
为整数常数项。
对每个客户数据,分别建立一元线性回归方程,采用最小二乘法估计参数。模型检验结果显示,各客户模型的决定系数R2均在0.7~1之间,说明对于这一类型的客户来说截止日期可以较好解释回款日期的变化。
3.1.3. 无规律回款类型
对于没有固定回款规律的客户,其回款时间具有随机性,传统预测模型效果较差。针对这一特点,本文采用蒙特卡罗模拟方法对个体客户进行模拟:基于客户历史回款数据构建概率模型,并从中随机采样,多次模拟客户的回款时间,通过大量重复模拟,最终以出现次数最多的回款时间被视为预测值。相较于传统预测方法,蒙特卡罗模拟充分考虑了回款时间的随机变化性和个体差异,是针对无回款规律客户更合理的预测模型。
蒙特卡洛模拟是一类基于大规模随机采样来模拟随机过程的统计方法。其基本思想是利用概率分布生成大量随机数,通过随机事件的多次发生,获得随机过程的统计特征。与精确计算方法相比,蒙特卡洛模拟跳过了复杂的数学推导过程,通过模拟随机性,直接给出统计估计结果 [12] 。
考虑到应收账款管理的实际业务场景需要,本文建立月度时间粒度的回款预测模型。对于每月初存在的所有未收回的应收账款订单,定义每个客户的每个订单在预测月是否发生回款看作随机变量
,其中,j为客户索引,k为订单序号。
是仅取0与1的随机变量:
其中,
是预测月无规律类型客户数量;m是每个客户对应的应收账款的订单数量,对于不同的客户,m的值是不同的。
基于历史数据分析,同一个客户的不同订单是独立同分布的,每个订单
是相互独立的,定义每个订单的回款金额为
,则预测月回款总金额可以表示为:
随机变量
服从伯努利分布:
回款概率
受订单截止日期的影响,基于订单截止日期与预测月之间的关系,可将应收账款订单分为如下三个类型:截止日期在预测月前、截止日期在预测月内以及截止日期在预测月后。对于不同订单类型,其回款概率
的计算方法有所不同:
1) 截止日期在预测月前的订单。统计不同逾期天数的频数,拟合概率密度分布
,对给定的预测月和订单截止日的回款概率:
2) 截止日期在预测月内的订单。计算客户j历史订单在截止月时的不逾期回款概率
,在截止月逾期但在截止月回款的概率
,对给定的预测月和订单截止日的回款概率:
3) 截止日期在预测月后的订单。统计不同提前天数的频数,拟合概率密度分布
,对给定的预测月和订单截止日的回款概率:
其中,
为订单截止日,
为预测月首日,
为预测月末日。
此外,对于预测时出现的新客户,由于没有相关历史回款数据从而无法获知其具体的回款概率,而总体平均概率可以反映所有类型客户的回款概率特征,是新客户回款概率的一个合理估计,因此本文采用所有无规律类型客户总体平均回款概率值来代替新客户的回款概率,以保证模型的泛化能力。
3.2. 预测结果分析
鉴于应收账款预测属于时间序列问题,数据之间存在时间依赖性,本文采用留出法进行划分训练测试集。以2020.01~2022.07共31个月的数据作为训练集,用于构建模型;以2022.08~2023.03共8个月的数据作为测试集,模拟实际业务中模型应用场景下的效果。为评估预测结果,本文设定按照应收账款订单截止日期统计的当月回款金额作为基准值,原因是在没有客户外部信息的情况下,人为处理应收账款账单时,也只能依据订单截止日期进行预测。如果模型预测优于该基准,则证明模型有效。
3.2.1. 总体预测效果
模型在测试集上的总体预测误差率及基准误差率如表3所示。在8个月测试结果中,有7个月的预测误差率的绝对值低于对应的基准误差率的绝对值,尽管2023年1月的个例预测效果较弱,但整体显示出模型对不同时期数据具有较好的适应能力,证明了模型的总体预测稳定性。综合来看,总体模型预测误差率低于基准误差率,表明模型相对于基准具有更优异的预测效果。
![](Images/Table_Tmp.jpg)
Table 3. Comparison of prediction error and reference error
表3. 预测误差与基准误差对比
3.2.2. 各部分预测效果
基于对模型总体预测误差率的结果分析,为进一步查看三个类型客户分别对应的预测模型的预测效果,图1比较了三类客户在测试集上实际回款金额与预测回款金额。从图中可以看出,个体回款习惯类型的金额最小,预测偏差也最小,模型预测效果最佳;依赖截止日期类型的金额最大,个别月份的预测误差相对较大;无规律类型的金额介于两者之间,个别月份的预测误差相对来说最大。依赖截止日期类型与无规律类型预测误差较大的月份均为2022年10月、2022年12月以及2023年1月这三个月,其他月份两类模型预测效果较好,产生这一现象的原因是:2022年10月与2023年1月包含长假(国庆节和春节),会影响客户正常的回款节奏,从而导致截止日期落在长假期间的应收账款预测产生较大偏差;而2022年12月份可能是由于客户年底财务清算等特殊因素影响。
![](//html.hanspub.org/file/18-2623879x45_hanspub.png?20240529082658369)
Figure 1. Comparison of the actual return value and the predicted value of different types of customers
图1. 不同类型客户实际回款值与预测值对比
3.2.3. 蒙特卡洛模拟预测效果
为探究蒙特卡洛模拟对无规律类型客户预测的效果,对不同月份蒙特卡洛模拟结果分布图进行对比分析,蒙特卡洛模拟10000次结果如图2所示,在整个预测期间内,各月份的模拟结果分布图均呈钟形曲线形状,但分布范围存在差异。其中,2022年11月和2023年3月分布最集中,预测结果最稳定,说明所建立的概率模型可以较好的反映客户的回款行为,有良好的拟合和预测能力;而2022年10月和2023
![](//html.hanspub.org/file/18-2623879x46_hanspub.png?20240529082658369)
![](//html.hanspub.org/file/18-2623879x47_hanspub.png?20240529082658369)
![](//html.hanspub.org/file/18-2623879x48_hanspub.png?20240529082658369)
![](//html.hanspub.org/file/18-2623879x49_hanspub.png?20240529082658369)
Figure 2. Monte Carlo simulation distribution map of different months
图2. 不同月份蒙特卡洛模拟分布图
年1月分布范围最为广泛,预测误差最大,表明节日等因素对这些月份客户回款的影响较大,建立的概率模型难以预测。
不同月份对模型预测能力影响各异,无规律类型客户的预测结果会随月份变化而波动,特定月份如长假月的预测分布范围扩大,预测稳定性降低,导致预测误差较大,这说明无规律类型客户的预测结果与时间期间有密切关系,若要全面提升无规律客户整体的预测精度,需要增强对时间因素影响的建模和适应能力,才能让更多月份呈现出稳定集中的预测分布。
4. 总结
本文对不同类型的客户分别建立了不同的预测模型,预测结果显示,在8个月的测试期间内,有7个月的预测误差绝对值低于基准误差绝对值,平均降低了约10%,显示出模型较为优异的预测能力,以及在不同时期数据上的良好适应能力,证明了其整体预测的稳定性。在2023年1月的预测中,模型表现相对较弱,预测误差绝对值高于基准误差绝对值,但考虑到该月包含春节长假,这种特殊情况可能导致客户回款节奏异常,从而影响预测精度。总体来说,本文提出的通过构建多种预测模型,较好地解决了应收账款回款时间预测的问题,这些模型的应用有助于企业更好地进行财务管理,但这些模型还有不足之处,未来仍需不断优化模型,以实现更精准的预测,为企业财务管理提供更加科学、有效的工具和方法。