1. 引言
狭义上,企业财务欺诈是指企业为了欺骗投资者、债权人等相关方故意伪造、篡改或隐瞒财务报表信息的行为;广义上,企业财务欺诈包括任何企业在财务报告中故意提供虚假或误导性信息的行为,不仅限于财务报表的篡改,还包括非法转移资金、操纵市场价格等欺诈行为。在投资者的角度上,财务欺诈是指企业在财务报表中故意提供虚假信息导致投资决策的错误或损失。尽管这些定义在细节上有所不同,但它们都强调了企业故意提供虚假或误导性信息的行为,以及对利益相关方的损害。无论采用何种定义,准确识别和检测企业财务欺诈都是维护金融市场稳定和投资者利益的重要任务。
为了保护投资者利益、维护市场秩序、防范企业风险,财务欺诈检测问题一直为学术界、企业界以及政府管理部门所重视。目前企业财务欺诈检测的方法路径主要有两个:基于财务指标的财务欺诈检测和基于文本信息的财务欺诈检测。
本文对企业欺诈领域的文献进行了综合梳理,系统性地总结了当前研究的主要成果和发展趋势。通过对不同研究方法和模型的综合比较,本文揭示了企业欺诈检测领域的研究现状,并提出了未来研究的重要方向和挑战。本综述的边际贡献在于对先前综述文献所未涵盖的样本范围进行扩展,为研究者提供全面的研究视角,促进学术交流和跨学科合作,为进一步深化企业欺诈检测研究提供有益的启示。
2. 基于财务数据指标的财务欺诈检测
财务报表中包含公司的资产、负债、权益、收入、支出、现金流等财务信息,是公司用来检测财务业绩并做出合理决策的有效工具,同时也是社会、政府监管部门和投资者衡量企业经营状况的重要工具。基于财务指标进行的财务欺诈检测是依据公司出具的财务报表数据进行的。
2.1. 财务指标的选取
财务报表中的数据指标是企业财务和运营状况的综合体现,企业财务欺诈行为在财务报表中必然有所体现,具体表现形式为财务结构和财务指标的异常。指标的历史变化以及指标间的相关性对于欺诈检测有着重要的影响,因此在进行企业财务欺诈检测时要进行全面、合理、具体的财务指标选取。黄学敏首次从行业间横向和企业自身纵向比较两个维度出发,通过LPM模型和Logit模型回归分析发现,6个基于期间费用、折旧、财务损益和应收账款的财务指标统计显著性较高,可以作为预警指标 [1] 。杨芳等人首次从实证角度提出,在财务欺诈识别模型中引入现金流量指标,可以提高模型的识别能力 [2] 。袁先智等人则以吉布斯随机搜索算法对上市公司的财务报表数据进行分析,解决了由于财务报表勾稽产生的高维数据灾难问题,并提取出八个可以刻画上市公司财务欺诈风险的关联特征因子 [3] 。陈孝新从财务杠杆、权责发生制、资产盈利能力三方面进行考量,选择出资产负债率、资产毛利率、资产周转率和运营资金比率四个模型显著性比率,将检验准确率提升至93.33% [4] 。
以上研究注重检测指标的选择,忽略了企业在时间序列上的表现。余玉苗关注到动态指标对于鉴别财务舞弊行为的有利性,从欺诈行为发生前一年与当年财务指标的动态增量视角入手,发现固定资产增长率、经营现金流量对流动负债比率等五个财务指标的变动对财务舞弊产生重要影响 [5] 。熊苪卿提炼使用时序指标,提升了模型的识别精度,并且证明比值指标优于差值和相对值指标,较近年份的时序指标影响力更大 [6] 。
企业欺诈检测指标选择经历了由静态向动态拓展的演变过程。动态指标的引入提升了模型的识别准确性,有助于更全面地评估企业的财务状况和发展态势。
2.2. 模型的选择
常见欺诈的类型分为四类:银行欺诈、财务报表欺诈、保险欺诈和加密货币欺诈。据Al-Hashedi等人调查,共有34种数据挖掘技术被用于识别各种金融欺诈行为,大多数技术被用于银行欺诈和保险欺诈 [7] 。其中,支持向量机(SVM)、神经网络(NN)和随机森林(RF)是使用最为广泛的金融欺诈检测技术。从1995年开始,Persons首先利用Logistic模型从初选的各项财务指标中选取了与欺诈相关的4项指标 [8] ,之后便不断有人试图将各种大数据挖掘技术应用于财务报表欺诈检测领域,各种大数据挖掘技术得到了创新与发展。
2.2.1. 支持向量机(Support Vector Machine)
支持向量机(Support Vector Machine, SVM)是一种基于统计学习理论的监督学习算法,广泛应用于模式识别和机器学习领域。其主要目标是在高维空间中找到一个最优的超平面,能够对不同类别的样本进行最佳的分类。
SVM具有较强的泛化能力,可有效处理高维数据。邓青山首次采用SVM构建财务欺诈检测模型,利用6个财务指标进行训练和验证,SVM的平均准确率达到了87.79%,成功验证了其在财务欺诈检测方面的有效性 [9] 。
通过引入核函数,SVM能够有效地处理非线性分类问题。李秀智和应双双采用Lib-SVM算法,结合RBF核和线性核构建了一种用于检测调节利润财务报表欺诈的模型,在预测准确率方面达到了86.67%,明显高于Logistic回归模型的表现水平。这表明该模型在识别财务报表欺诈方面具有较高的潜力和准确性 [10] 。
此外,SVM在预测性能方面表现表现良好,并且在小样本数据集具有较好的性能。Moepya等人对比了SVM模型与k最近邻(kNN)方法和Logistic回归(LR),结果显示,SVM方法提供了更高的分类准确性 [11] 。Yao等人将SVM、KNN、分类与回归树(CART)、反向传播神经网络(BP-NN)、逻辑回归(LR)和贝叶斯分类器(Bayes)进行对比,发现SVM在所有条件下都具有最高的准确率 [12] 。El-Bannany等人将SVM、LR、NN和决策树(DT)应用于阿拉伯联合酋长国(UAE)公司财务报表欺诈检测,SVM的准确率为89.54%,优于其他分类器 [13] 。Chi等人将SVM、决策树C5.0和CHAID模型相互结合应用于财务报告欺诈的检测,发现SVM与其他模型相结合形成的模型具有较好的预测性能 [14] 。
SVM在检测企业财务欺诈问题上也存在一些挑战和限制。对于大规模数据集,支持向量机的计算复杂度较高,需要较长的训练时间和更多的计算资源。SVM核函数的选择需要一定的经验和领域知识,选择不当可能影响模型性能。支持向量机对于噪声和异常点比较敏感,可能导致模型过度拟合或者性能下降。
2.2.2. 神经网络(Neural Network)
神经网络(Neural Network, NN)又称人工神经网络(Artificial Neural Network, ANN),是一种基于生物神经元结构和功能而发展起来的计算模型,通过采用反向传播算法(Back Propagation, BP)比较网络的输出和目标输出之间的误差并最小化误差,来解决分类、回归、聚类、图像和语音识别等各种问题。神经网络具有可处理非线性问题、自适应性强、并行处理能力强和可泛化能力强的优点,在欺诈检测应用性较强。
Fanning等人于1998年首次利用ANN深入检查财务报表,并发现ANN是一个具有高概率检测虚假财务报表的模型 [15] 。Rizki等人应用SVM和ANN进行财务欺诈检测,发现ANN对没有特征选择的数据产生最高的准确率,为90.97% [16] 。Lin等人将人工神经网络与逻辑回归和决策树(CART)对比应用于分类测试,发现ANN对训练样本和测试样本的正确分类率分别为91.2%和90.4%,均高于CART方法和Logistic模型 [17] 。Nawaiseh等人探讨了基于支持向量机(SVM)、人工神经网络(ANN)和K最近邻(KNN)作为财务报表审计预测分类模型的数据挖掘能力,实证结果表明,人工神经网络和支持向量机技术在非欺诈公司正确分类方面取得了更高的平均准确率 [18] 。范斌等人针对财务凭证多类型数据(文本数据、类别型数据和数值型数据)和数据正负样本比例失衡问题,基于代价敏感学习对多分支深度神经网络算法进行了改进,有效地缩小了审查范围,而且模型在负样本数据不断丰富的情况下准确度也实现不断提升 [19] 。人工神经网络与逻辑回归、支持向量机、K近邻等机器学习算法相比综合性能较好,在财务欺诈检测中具有较高的检测精度。
2.2.3. 集成算法(Ensemble Method)
集成算法是一种机器学习技术,旨在通过将多个基本学习器(通常是弱学习器)的预测结果进行组合,以获得更准确、鲁棒的预测或分类结果。与传统机器学习算法相比,集成算法可以减少过拟合和欠拟合现象的发生,可以修正模型的错误,具有较强的鲁棒性和预测性能。常见的集成算法有袋装法(Bagging)即随机森林、提升法(Boosting)包括AdaBoost和Gradient Boosting和堆叠法(Stacking)。其中,常见的Gradient Boosting算法有XGBoost和LightGBM。
Perols比较了六种流行的统计和机器学习模型的表现,使用堆叠分类器检测财务欺诈,并与单个分类比较 [20] 。然而,该研究在组合模型时没有考虑基分类器的多样性,导致得到令人惊讶的bagging和堆叠分类器次优结果。Song等人通过四个分类器(逻辑回归、反向传播神经网络、C5.0决策树和支持向量机)和这些分类器的集合进行实验,实验结果表明,集合分类器在准确性和复合错误率方面分别优于单个分类器 [21] 。此外,在真阳性率即欺诈公司被正确归类为欺诈公司方面,集成方法优于其他方法 [22] 。
企业财务欺诈检测问题具有高度不平衡性,Ye等人使用SMOTE进行采样检测,采用随机森林来学习不平衡数据,在11726份财务报表中,随机森林的检测准确度优于ANN、LR、SVM、CART等其他算法 [23] 。Liu等人将集成模型与SVM、LR等传统模型进行对比,通过比较两者的AUC和KS值,发现集成模型XGBoost、LightGBM和RF的识别能力更强,此外还使用AUC值最高的Smote过采样算法处理样本数据集不平衡问题 [24] 。
Ali等人使用SMOTE解决样本数据类不平衡问题,利用集成算法XGBoost构建财务欺诈检测模型,并和LR、DT、SVM、AdaBoost以及RF五种机器学习技术一同进行预测财务欺诈,实证结果表明,优化之后的XGBoost的预测结果最优,模型检测准确率最高 [25] 。同样,Khedr等人也在识别来自中东和北非地区的一组样本公司的欺诈行为过程中得出了相同的结论 [26] 。Achakzai等人使用动态集成选择技术(DES)构建了一个集成模型,与静态集成学习相比,DES在运行时会根据样本数据和其他因素的变化动态地组合一组基本分类器的预测结果作为最终预测,以提高模型的泛化性能和鲁棒性 [27] 。
3. 基于文本信息的财务欺诈检测
对上市公司欺诈识别的研究,经历了从简单到复杂的过程,研究路径由简单的模型分析到建立回归分析再到复杂模型的应用最终到采用混合分类器的集成算法进行研究。这些研究局限于对结构性财务数据进行识别,审查公司在已经过去的季度或者年份的表现,研究具有一定的时间滞后性。利用社交媒体平台实时产生的丰富内容可以极大地解决财务报表的滞后性问题,这需要运用到文本挖掘技术。
文本挖掘技术是一个集普通语言处理、信息检索、web挖掘、计算语言学、数据提取和数据挖掘为一体的跨学科领域,具有很高的商业价值。数据性指标由于结构化程度高、精确度和准确性高、可量化等优点被广泛应用于企业财务欺诈识别研究领域。而文本数据却能提供更加综合和全面的信息,与各种指标结合起来,可以更好第体现数据所反映的现实问题。文本数据作为一种非结构化数据,在金融和会计分析领域的应用已经被证实具有重要作用,主要集中应用于信息品质和数量的分析、信息披露和市场异常的研究,以及构建企业性能指标的分析。这些应用场景包括但不限于交易监测和异常检测、舆情监测、内部调查和举报管理、合规监督和报告,还有舆情预警和风险管理。这些应用是文本数据分析的重要工具,并且具有广泛的适用范围。
3.1. 文本数据来源
文本挖掘技术可以对不同的数据源进行企业欺诈识别。公司的财务报表是最直接的来源之一,其中包含了公司的财务状况、经营活动和盈利能力等信息。这些报表中的文字描述、注释、管理层讨论和分析部分都可能含有关键信息,可以用于进行文本挖掘和分析。
公司相关的新闻报道、行业分析、舆情监控等媒体信息都可以作为文本数据来源。这些信息可能包括对公司经营活动、产品、服务、管理层及员工的评价和看法,以及市场反应等内容。新闻报道可以真实地反映出大众对公司的评价,这些评价体现出的情感倾向可以较为真实地反映出上市公司以及非上市公司的经营状况和盈利水平。以新闻报道等媒体信息作为数据源打破了只能对上市公司进行财务欺诈检测的限制。此外,通过社交媒体平台、在线论坛、博客评论等渠道,收集关于公司或其产品、服务的用户评论、投诉、赞扬等信息也可以作为文本数据源。
另一个比较重要的数据源便是企业公告。上市公司主要通过公告来披露文本信息,主动披露有关事项可以减轻公司管理层和信息需求者之间的信息不对称问题。为了让外界全面了解公司情况,通常公告会包含多方面内容,如业绩报告反映公司运营状况、重大事项和风险公告,以及停牌复牌的交易提示等。
3.2. 文本挖掘在财务欺诈检测的应用
虚假财务报表和非虚假财务报表在主/被动语态结构、语气词等语言特征方面存在差异。有研究表明,年度财务报告中的财务指标信息隐藏的欺诈细节可以由报告中的语言线索进行补充,以此评估年报的真实性和诚实程度。财务异常识别的文本挖掘技术集中应用在财报的MD&A部分,文本挖掘的应用缺乏一个系统的、整体的、理论的分析框架来指导欺诈检测工作。董伟将主题、观点、情感、情态、人称代词、写作风格和体裁七种信息类型提取词级特征和文档级特征用于线性支持向量机分类器的输入,在十倍交叉验证下,该分析框架的分类平均准确率为82.36%,优于使用财务比率的基线方法 [28] 。公司财务报表的定性信息提供了有用的信息,可以提高欺诈预测模型的准确性 [29] 。程双双等人以财务报表中的MD&A为文本数据,采用长文本分类模型XLNet_HAN进行财务欺诈识别检测,该模型在处理非平衡特性的文本数据方面具有更好的性能 [30] 。
针对财务报表数据识别的时滞性,李华玲等人通过爬取东方财富网和金融界股票频道新闻库中的实时新闻进行了模型识别,提取了文本数据中的有效隐含信息,提高了识别企业欺诈行为的及时性 [31] 。现阶段单纯的文本数据研究较少,研究人员更倾向于文本信息和财务指标信息相结合,以提高检测准确度。
为了比较文本信息和财务指标信息对财务造假识别的影响,有人对比了基于财务指标、基于新闻情感、基于财务指标和新闻情感的三种上市公司财务造假Logistic识别模型的性能差异,发现综合新闻情感与财务指标的模型准确率最高。Craja等人利用分层注意力网络(HAN)从MD&A中提取文本特征与财务比率信息相结合,发现文本特征提供了更有希望的分类结果,并大大增强了财务比率的检验效果 [32] 。刘会醒等人利用Jieba分词从文本语调、相似度和复杂度三个角度构建了文本指标,将MD&A中文文本信息和财务指标信息加入到Stacking集成算法模型中,分类器的识别性能在准确率和召回率方面得到了显著的提升 [33] 。
此外,考虑到指标在时间轴上的变化,陈朝焰等人在财务指标数据中融入财经新闻文本特征并提取时序信息,将准确率提高了8%,为数据特征提供了有效的补充 [34] 。李爱华和肖庆兰则通过融合多种数据源的方式再次验证了文本特征对于财务欺诈检测的有效性 [35] [36] 。
文本数据的引入拓宽了研究对象和研究范围,弥补了财务指标数据在时间上的滞后性,增强了数据的真实性,但同时也存在一些问题。第一,文本信息本身不够明确,需要研究者进行加工处理才能用于计量分析,这可能引入噪音和错误,并且数据处理的可重复性存在争议。第二,大部分文本数据缺乏权威来源,数据的可靠性有待考量。第三,由于文本数据量庞大,现有的计量分析方法并不一定适用。第四,应用文本大数据分析技术研究会计和金融问题对研究者的综合能力,尤其是编程和数量分析能力提出了挑战。这些问题都有待进一步解决。
4. 最新研究进展与结论
目前,利用财务报表进行欺诈检测的研究已经涵盖了各种机器学习方法,对于文本信息的研究正逐步从以MD&A为中心向其他信息源拓展,对于信息的横向和纵向特征的选取上也有了更多的考量。与此同时,对于财务欺诈检测新模型、新方法和新指标的研究并未停歇。在模型的创新上,Islam等人针对数据集高度不平衡问题,开发了一个不涉及任何重采样技术的欺诈交易检测规则——基于规则的模型(RBM),模型性能优于现有的机器学习模型 [37] ;Innan等人提出了使用量子图神经网络(QGNN)检测金融欺诈的新方法,使用变分量子电路(VQC)提高QGNN的性能,使其可以处理图结构数据 [38] ;Wu等人基于异构图神经网络提出了一个多任务学习框架——MultiFraud,用于复杂的欺诈检测和提供合理解释,实现欺诈检测跨领域执行和解释 [39] 。为了确定审计师之间财务欺诈的风险概况,Munteanu等人应用多对应因子分析(AFCM),建议将财务指标分为四类:盈利能力指标、融资和负债指标、流动性指标和业务活动报告 [40] 。财务欺诈问题一直为社会和群众所重视,Kanaparthi发现从2017年到2022年,财务欺诈领域的出版物显著增加,这凸显了人们对该领域日益增长的兴趣和不断扩大的研究活动,也表明了该领域在当代学术领域的潜在意义和相关性 [41] 。
本文基于企业财务欺诈文献梳理发现,对于企业财务欺诈识别的研究主要集中于基于财务报表指标检测、优化模型和解决不平衡样本问题,将公司类型限制在上市公司范围内,忽略了财务报表在时间上的滞后性。文本挖掘技术引入的文本信息补充了更多的细节信息,有效解决了基于财务指标欺诈检测的滞后性,同时也将非上市公司纳入到可进行欺诈检测领域,拓宽了研究对象和范围。文本信息的应用在信息的处理、数据质量的提升、与现有机器学习模型的契合度以及与其他信息源的融合等方面还没有得到有效的进步,有待进一步研究。
NOTES
*通讯作者。