1. 引言
金融市场的波动是一个复杂而又变幻莫测的领域,受多种因素的影响,其中包括宏观经济状况、公司业绩、政策变化等。投资者一直在寻找能够解释股票市场行为的规律,以期望更好地理解市场的运作并做出明智的投资决策。在这个探索的过程中,本福德定律成为一个备受关注的现象,这一定律揭示了自然界和社会领域中数字的分布规律。近年来,研究者们开始将这一定律引入到金融领域,以探究股票市场中是否存在数字的隐藏规律,并探讨这些规律对股票收益率的潜在影响。
本文旨在研究本福德定律在上市银行股票收益率中的表现,探讨首位非零数字的分布规律是否在银行股票的日度收益率中呈现出某种趋势。银行股票作为金融体系的重要组成部分,其表现往往受到宏观经济政策、利率变动等多方面因素的共同影响。然而,在这种看似复杂的市场中,数字的分布是否能够展现某种规律成为一个引人关注的问题。
本文首先将对本福德定律进行简要介绍,阐释其在其他领域中的应用和普遍存在性。接着,我们将详细分析上市银行股票的日度收益率数据,通过统计方法检验首位非零数字的分布情况,并比较实际数据与本福德定律的预期是否相符。通过这一研究,我们希望能揭示银行股票市场中潜在的数字分布规律,为投资者提供更多关于市场行为的信息,从而辅助其在投资决策中做出更为明智的选择。
2. 文献综述
2.1. 本福德定律相关研究
对于本福德定律的研究,数学家Pinkham (1961)研究发现,本福德定律不受任何度量单位的约束,为本福德定律的证明提供了基础[1]。随后,本福德定律在人口等领域得到广泛应用。Carslaw (1988)最早将其引入会计领域,随后更多学者将其运用于会计与审计领域[2]。Nigrini M J (1992)的研究表明本福德定律可用于检测数据造假[3]。Christoph,Ralf和Robert (2008)发现本福德定律可作为审计选择工具,但审计师需谨慎确保其适用于未经处理的未来审计目标数据[4]。Matthew,Stephen和Rice (2010)成功使用数字分析检测财务欺诈[5]。张苏彤(2005)对1394家上市公司的主要财务数据进行了本福德定律检验,认为可将其用于舞弊审计分析[6]。同样的,王大江(2014) [7]、邓佳军(2018) [8]和赵欢欢(2020) [9]等也认为本福德定律可以用于审计分析。许存兴和张芙蓉(2010)对被出具非标审计意见的上市公司财务数据进行了本福德检验,结果显示这类公司财务造假现象逐年下降[10]。陈曦等(2012)选取我国2000~2010年间上市公司的年度及季度财务报表数据研究发现,公司财务数据分布规律与本福德定律相关性越低,造假可能性越大[11]。李艳和欧阳良伟等(2017)认为本福德定律适用于检验资产负债表质量[12]。罗玉波(2016)认为其可用于检验数据与真实值偏离程度,从而了解财务欺诈情况[13]。杨贵军等(2019)构建了带Benford因子的Logistic模型,发现新模型对财务舞弊样本点的识别准确率高于普通Logistic模型[14] [15]。
2.2. 本福德定律与收益率相关研究
在国外,将本福德定律应用于股票市场的研究并不多。Ley (1996)对道琼斯工业指数和标准普尔指数的股票日回报率进行了研究,发现日回报率的首位数分布大致符合本福德定律[16]。Ceuster等(1998)通过本福德检测证明了在股票市场中不存在支持心理障碍假设的证据[17]。Diekmann (2007) [18],Gunnel和Todter (2007) [19]则运用本福德定律来检测科学数据伪造和经济数据。Corazza等(2011)使用本福德定律检测发现,标准普尔500股票市场指标数据的首位数分布情况遵循本福德定律[20]。Matakovi (2019)检验了克罗地亚公司的财务声明是否偏离本福德定律,并以此来检测是否存在异常交易等情况[21]。Gonzalez (2020)则利用本福德定律研究了阿根廷收入报告中的异常数据[22]。在国内,相关研究较为有限。Li等(2004)发现单个交易日的股票价格的首位数分布几乎符合本福德定律[23]。Zhang和Kang (2007)检测了中国上市公司的财务数据与本福德定律之间的差异[24]。Zhao和Wu (2010)选择上证综合指数和成分指数证实了中国股票市场服从本福德定律[25]。Shi等(2017)研究了主要发展中国家的金融报告数据的可信度[26]。Xie等(2019)运用本福德定律检验金融数据,并认为如果金融数据符合本福德定律,则没有证据表明审计费与首位数得分之间存在关系[27]。
3. 相关理论和模型介绍
3.1. 本福德定律
本福德定律(Benford’s Law)是一个关于数据首位数分布规律的定理,最早由美国天文学家Simon Newcomb发现,但Simon当时并未做大量的实证研究来支持该规律,也未对其做出合理解释。半个世纪后,美国物理学家Frank Benford对这一现象进行研究,他收集了自然界的大量数据进行实证测试,最终证实了该规律,计算得到了具体的数字分布规律。本福德定律指出,在许多自然数据集中,以1开头的数字比例要比其他数字开头的数字要大。这个规律在一些数据集中如财务报表、人口统计等中常常成立。本福德定律的表达式为:
Pn = lg(1 + 1/n),n = 1,2,3,...,P为首位数出现的概率。
依据数学表达式计算得表1结果:
Table 1. Probability distribution of the first digit
表1. 首位数出现概率分布表
n |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
p |
0.30103 |
0.17609 |
0.12494 |
0.09691 |
0.07918 |
0.06695 |
0.05799 |
0.05115 |
0.04576 |
3.2. 市场有效性理论
市场有效性理论是由美国经济学家尤金·法玛于1960年代提出的,它是现代金融理论中的一项基本概念。市场有效性理论认为,在一个有效的金融市场中,所有公开信息都已经充分地被反映在资产价格中,投资者无法通过分析已公开的信息来获取超过市场平均水平的利润。这一理论的提出对后来的金融研究和实践产生了深远的影响。市场有效性理论的提出挑战了一些传统的投资策略,如技术分析和基本面分析。
根据市场有效性理论,如果市场是有效的,那么股票收益率不会受到外界信息的影响,股票收益率波动处于一个自然状态,那么上市银行股票收益率的首个非0数字的分布规律应该基本符合本福德定律,因此,本文提出假设:
H1:以年度为期限,上市银行股票日度收益率首个非0数字分布规律基本符合本福德定律。
3.3. 行为金融理论
行为金融理论是一种对传统金融理论的补充,它强调了投资者在决策过程中可能存在的非理性行为和心理偏差,以及这些行为对市场和资产价格的影响。与传统的理性预期和市场效率理论不同,行为金融理论认为市场参与者并不总是理性的,他们的决策可能受到情感、认知错误和群体行为的影响。其中一些关键理论和概念包括羊群效应、投资者情绪、投资者风险偏好理论、套利等[28]-[30]。
根据行为金融理论,当股票日度收益率首个非0数字分布规律基本符合本福德定律,即该股票收益率是自然波动的时候,联系到本福德定律,数字越大概率越小,因此这里也可以将收益率波动自然看作收益率波动较小。根据部分学者的研究,投资者更倾向于投资波动性较小的股票。加上羊群效应的影响,收益率波动更自然的股票更可能为投资者带来更大的收益。因此,本文提出假设:
H2:以年为期限,上市银行日度收益率的首个非0数字分布规律与本福德定律相关性越高,其年度收益率与基准指数年度收益率之差越大。
3.4. 模型介绍
为了验证假设H1,本文参考许金叶和施旖旎(2019) [31]的做法,用Excel中的CORREL函数计算股票日度收益率首个非0数字分布规律与本福德定律的相关系数。
针对本文的假设H2,设计如下模型来检验:
ΔP:上市银行股票年度收益率相对基准指标收益率的差。
ρ:上市银行股票年度收益率的数字分布规律与本福德定律的相关度指标。
本文实证将用到的变量及其计算方式如下表2所示。
Table 2. Variables table
表2. 变量表
变量名称 |
变量代码 |
计算方式 |
相关度 |
ρ0 |
CORREL函数计算获得 |
股票收益率 |
Pj |
|
指数收益率 |
Pz |
|
收益率差 |
∆P |
|
频率差平方和 |
ρ1 |
,i = 1,2,…,9,pbi = 本福德定律下数字i的频率 |
差异度 |
ρ2 |
1 − ρ0 |
4. 实证研究
4.1. 数据来源
本文需要的数据包括股票自2015年1月1日起到2023年12月31日为止的日度收益率数据,以及股票自2015年起到2023年为止的年度收益率数据。为了排除研究对象中行业因素的影响,以及公司经营稳定性和数据可得性等原因,本文选取了我国银行业上市公司为研究对象。另外,本文选取的股市综合指数为上证综合指数(指数代码000001),沪深300指数(指数代码000300),国证A股指数(指数代码399317)和中证A股指数(指数代码930903)。上市银行和股市指数的相关数据均来源于国泰安数据库。
4.2. 实证检验
首先,本文从国泰安平台上获取的上证综合指数、沪深300指数、国证A股指数和中证A股指数2015年1月1日至2019年12月31日的日度收益率,先用Excel表格中的ABS函数获取日度收益率的绝对值,为尽可能减少数字0的干扰,对收益率的绝对值进行乘1000处理,再使用LEFT函数获取各指数日度收益率的首个除0以外的数字,再分别对1至9的数量进行统计,计算各数字的分布频率,最终得到如下表3的结果。
然后利用CORREL函数分别将四个指数日度收益率的数字分布频率与本福德定律得到的数字分布频率进行比较,得到的结果如下表4。
Table 3. Frequency of digital distribution of index daily returns
表3. 指数日度收益率数字分布频率表
|
000001 |
000300 |
399317 |
930903 |
1 |
0.304945055 |
0.350274725 |
0.369505495 |
0.350274725 |
2 |
0.149725275 |
0.138736264 |
0.152472527 |
0.152472527 |
3 |
0.09478022 |
0.097527473 |
0.085164835 |
0.090659341 |
4 |
0.105769 |
0.085164835 |
0.075549451 |
0.085164835 |
5 |
0.092033 |
0.072802198 |
0.085164835 |
0.083791209 |
6 |
0.067307692 |
0.065934066 |
0.070054945 |
0.068681319 |
7 |
0.067307692 |
0.052197802 |
0.053571429 |
0.06043956 |
8 |
0.063186813 |
0.067307692 |
0.059065934 |
0.057692308 |
9 |
0.054945055 |
0.070054945 |
0.049450549 |
0.050824176 |
Table 4. Correlation between the distribution frequency of index daily return figures and Benford’s law
表4. 指数日度收益率数字分布频率与本福德定律相关度
|
000001 |
000300 |
399317 |
930903 |
ρ0 |
0.980213899 |
0.961600989 |
0.966567471 |
0.974301336 |
从上表3可以看出,选取的四只综合型指数中,上证综合指数(指数代码000001)的日度收益率的数字分布频率与本福德定律的相关度最高,因此本文选择该指数的年度收益率作为基准收益率。
选定基准收益率后,本文对上市银行自2015年1月1日起至2023年12月31日为止的9年间的日度收益率以年为期限,分别统计每一年内各只股票日度收益率的数字分布频率。对部分数据缺失严重的年份以及数据分布明显不合理(比如当年某只股票的日度收益率首个非0数字未包括1~9全部数字等)的年份或股票进行剔除后,使用CORREL函数将股票日度收益率的数字分布频率与本福德定律相对应的数字分布频率进行比较,得到相关性指标ρ0,并将ρ2 (即1 − ρ0)命名为差异度。并将股票日度收益率的数字分布频率与本福德定律相对应的数字分布频率进行差方计算,得到ρ1,将其称为频率差平方和,本文认为频率差平方和越大,则相关性越小。在进行稳健性检验时,ρ1将作为替代解释变量进行回归检验。
首先对上市银行日度收益率的相关度数据ρ0进行描述性统计,其最小值约为0.804,最大值约为0.998,平均值约为0.939,中位数约为0.954。表明上市银行股票日度收益率的数字分布规律与本福德定律有较大相关度,即以年为期限,上市银行股票日度收益率的数字分布规律基本符合本福德定律,H1得到验证。
对假设H2进行检验时,本文使用的是SPSS进行回归检验。需要特别说明的是,在进行回归检验前,本文根据将收益率差进行了绝对化处理。将处理后的收益率差与频率差平方和数据代入模型,得到如以下表5的检验结果。
Table 5. Linear regression test results
表5. 线性回归检验结果
|
系数 |
t值 |
P值 |
α |
0.198 |
13.221 |
0.000** |
β |
−0.452 |
−2.348 |
0.020* |
注:*、**分别表示在5%和1%水平上显著。
由上表5,频率差平方和的P值为0.020,在5%的水平下显著,说明差异度会对收益率差产生显著的负向影响,说明差异度越大,上市银行股票相对基准指数的收益率越低,即上市银行股票日度收益率的数字分布规律与本福德定律相关度越低,股票相对基准指数的收益率则越低。因此,本文认为上市银行日度收益率的首个非0数字分布规律与本福德定律相关性越高,其年度收益率与基准指数年度收益率之差越大,H2得到验证。
4.3. 稳健性检验
为确保本文研究结论的稳健性,将ρ1 (频率差平方和)作为替换解释变量与收益率差进行回归检验,得到如下表6的回归结果。
Table 6. Robustness test results 1
表6. 稳健性检验结果1
|
系数 |
t值 |
P值 |
α |
0.192 |
13.013 |
0.000** |
β |
−1.627 |
−1.917 |
0.057 |
注:*、**分别表示在5%和1%水平上显著。
如上表6所示,更换解释变量后,回归结果虽然显示只在10%的水平下显著,但是依然能够在一定程度上显示上市银行日度收益率的首个非0数字分布规律与本福德定律相关性越高,其年度收益率与基准指数年度收益率之差越大。
为进一步确保本文研究结论的稳健性,用单变量排序组合分析方法验证差异度对股票收益率的解释性,具体来说是使用的单因素方差分析(One-Way ANOVA)方法。由于本文有174组数据,为实现组内数据量与组别数量之间的平衡,因此本文根据差异度排序后分为6组进行检验。排序分组结果及最终分析结论如下表7。
由下表7,发现差异度平均值最小组所对应的收益率差平均值为0.2103,相较于差异度平均值最大组对应的收益率差平均值的0.1605有非常大的明显的提升。且表7也显示差异度作为解释变量时,随着解释变量平均值逐渐减小,收益率差平均值遵循逐渐增大的规律。且P值也小于0.05,在5%的水平下显著。
Table 7. Robustness test results 2
表7. 稳健性检验结果2
|
差异度平均值 |
收益率差平均值 |
组1 |
0.1538 |
0.1605 |
组2 |
0.0815 |
0.1008 |
组3 |
0.0533 |
0.1656 |
组4 |
0.0378 |
0.1860 |
组5 |
0.0247 |
0.1997 |
组6 |
0.0130 |
0.2103 |
|
F |
p |
值 |
2.31362 |
0.046* |
注:*、**分别表示在5%和1%水平上显著。
综合上述稳健性检验结果,本文的研究结论具有一定的稳健性。
5. 结论
本文分析了本福德定律与上市银行股票收益率之间的关系,目的是找寻股票收益率的数字规律,并尝试探索本福德定律在投资者选择股票投资过程的作用。主要研究结论如下:
当期限足够长时,上市银行股票收益率的首个非0数字的分布规律与本福德定律有较大相关度。如果市场是有效的,那么证券资产价格就是自然波动,在足够长的期限内,证券资产的收益率就会呈现出与本福德定律类似或相关的数字分布规律。
上市银行股票日度收益率的数字分布规律与本福德定律相关度越低,股票收益率与基准指数的收益率之差也越小。虽然市场或许是有效的,但是投资者不一定全是理性的,因此羊群效应、投资者风险偏好等因素的存在,上市银行股票的收益率波动更自然的股票更容易获得投资者的青睐,使得该类股票更可能为投资者带来更大收益。