1. 引言
改革开放以来,我国市场一体化水平逐步推进,尤其是进入二十一世纪,互联网技术的发展为我国投资者提供了更多的投资渠道和投资机会,更容易接触到我国金融产品,直接促进了我国金融市场发展和金融体系进步。然而,大部分投资者缺乏相关的投资知识和经验,在购买高风险金融产品时盲目跟风、过度自信等交易错误造成亏损,同时缺乏有效的解读市场信息的能力,无法利用金融市场的信息实现风险对冲或者创造收益。基金作为一种投资工具,投资者可以通过购买基金参与金融市场交易,基金经理通过组合投资能有效降低基金产品的波动幅度,降低投资者的交易成本并且高流动性方便投资者进行买入和卖出。近年来我国的基金行业保持快速发展,截止到2023年9月,如表1所示,我国封闭式与开放式基金合计发行数量11,221只,净值合计约为274800.45亿元,相较于2015年2月,基金数量、基金份额和基金净值分别增长了467.57%、491.92%和465.34%,随着我国经济逐渐转向高质量发展的道路,我国投资者对金融市场的关注重心会更加偏向于基金市场,基金市场在未来仍具有一定的发展前景。
目前我国市场上的基金数量在不断增加,虽然数字技术的发展便利了投资者接触基金的渠道和投资选择,但基金投资的复杂度使得门槛在不断上升,产生的大量数据信息极易引发投资的信息不对称,对于个人投资者而言,投资的风险和收益更加难以衡量和明确。基金经理作为市场上具有一定金融素养和职业技能的人群,在管理名下基金时可以更好地整合市场信息、判断市场情绪,利用机构中的资源和技术减少信息不对称带来的不确定性,构造投资组合也会更全面的考虑风险与收益,给投资者带来两方面的效益,因此,投资者在选择基金产品时,也逐渐开始关注基金经理个人的履历,包括受教育程度、专业学位、性别、年龄等方面,在学术界也将基金经理个人特质纳入进基金业绩的考量范围,作为投资决策的重要依据。
数据来源:中国证券投资基金业协会。
2. 文献综述
基金的业绩评价是投资者在选择基金时的一项重要参考指标,从时间序列上评价整体风险和收益,Markowitz提出的“均值–方差”模型可以评估基金时间序列净值,更有效实现长期收益 [1] 。此后,Sharp提出的Sharp指数和Treynor提出的Treynor指数成为衡量基金业绩的重要参考 [2] [3] ,为基金业绩评价体系的完善奠定基础。后来学者们针对基金选股择时能力展开研究,Brinson和Fachler提出将基金收益分解为市场因素、行业因素和股票选择三部分 [4] ,这一模型得到了学者们的广泛应用与改进。Fama和French提出了三因子模型,模型将市场风险、规模风险和价值风险纳入考虑范畴 [5] ,通过对美国市场的历史数据进行回归分析,证明了规模和价值两个因子对基金业绩的影响。国内学者基于上述理论研究,实证发现我国基金具备一定的选股能力,但择时能力较为缺乏 [6] [7] 。此外,在不同的市场环境下,基金经理的能力也有显著差异。
针对基金经理的研究,主要集中在不同的个人特征方面,例如年龄、性别、学历背景、专业、工作经历等等影响着基金经理的风险态度和决策水平,间接对基金业绩产生影响 [8] 。研究发现,年轻的基金经理管理基金更为积极主动,基金表现也比较好,性别对基金业绩的影响并没有较大差别 [9] 。国内的基金经理中,教育背景、专业资格与基金业绩呈显著的正相关 [10] ,当市场处于不同的经济环境下,基金经理个人特质往往能起到超过市场平均水平,获得超额收益的显著效果。
资产配置是基金经理投资管理中的重要部分,根据不同的资产风格进行不同权重的资金分配,达到投资组合最优化,具体可以分为传统资产配置模型、风险平价资产配置模型、动态资产配置模型等,Markowit [1] 提出的均值–方差模型可以帮助投资者更好地分析资产收益率,从而找到最佳的资产配置方案,有效降低风险,提高预期收益。Ross [11] 通过无套利定价方法来解释资本资产定价的原理,即通过构建无风险投资组合和市场投资组合的组合来决定资本资产的定价和资产的预期收益率。Beach和Orlov使用GARCH衍生的观点作为Black-Litterman模型的输入,并证明通过此构建的投资组合的回报率超过了那些依靠等权重模型等的投资组合 [12] 。李仲飞和周骐(2021)提出基于复杂网络视角的投资策略 [13] ,并结合Black-Litterman模型构造资产配置策略,通过与均值–方差和传统Black-Litterman模型等资产配置策略的实证对比,发现Black-Litterman + 复杂网络的资产配置模型在夏普比率方面有了显著提升。
通过对基金业绩评价指标、基金经理能力特征及二者关联的相关文献梳理,可看出国内外具体的研究结论各不相同,但大都认为基金经理的能力特征与基金业绩之间存在关联。但很少有文献对基金经理的行业配置能力做研究,考虑到具有相应专业背景的基金经理在对应行业主题的基金持仓配置中,对产业链和产品会更加熟悉,对市场的把握与预期也会更加精准,本文首次构造基金经理对口专业背景这一指标并加入基金经理的个人特征指标中进行研究,具有较高的现实意义。在资产配置模型的各类研究表明,影响传统的风险平价和最小方差等模型适用性的主要原因是:投资者的影响因素被忽略。Black-Litterman模型能够充分考虑投资者的主观因素,从而有效地优化资产配置过程。但Black-Litterman模型自身也存在一定的缺陷,主要体现在观点向量的主观性上。一些研究人员试图使用时间序列模型(如ARMA和GARCH)来提升观点向量的准确性,以期获得更好的结果。尽管线性时间序列模型可以有效地预计未来收益,但是由于金融时间序列有着较高的噪声水平,以及自变量和因变量的相关性会随着时间序列而发生改变,因此在现实应用中很难准确预测未来收益。考虑到集成学习较高的预测准确率与很好的抗噪声能力,本文将其应用于Black-Litterman模型的主观观点优化中,使得投资者的主观因素有数据来源与依据作为支撑,从而更好地解释模型。
3. 理论介绍
(一) 集成学习理论
(1) Xgboost
Xgboost是一种基于极端梯度提升的决策树模型,通过构建多个决策树的集成模型,以提高预测的性能和准确性,相比于以往梯度提升算法,Xgboost使用了一种新的正则化技术,可以避免过拟合、支持并行计算等优点。因此,本文在对模型进行算法迭代时,考虑Xgboost具有高性能、高灵活性以及良好的拟合效果等特点,将其纳入集成学习模型中。
具体表达式为:
(1)
其中,
表示为根据模型
所预测的结果,K代表决策树的数量,
代表第K棵树,因此,Xgboost的损失函数可以表示为
(2)
其中,
表示训练中得到的
的误差,
表示第K棵树的正则化结果,Xgboost的预测具有
顺序性,因此在预测t棵树时,前t − 1棵树的结果已经训练完成,故正则化项和训练中获得的误差可以视为常数,对上式变形整理后可得:
(3)
通过数学上的泰勒展开,经过一系列的优化后得到客观函数如下:
(4)
在上式中
越小,代表结果越好,Xgboost算法迭代使用以下增益系数以实现最佳分裂点的选择。
(5)
(2) Catboost
Catboost由Categorical和Boosting构成,主要用以处理类别型特征问题,采用标签平均值以便更好地提取特征中关键信息,随着模型不断迭代,现有Catboost采用改进的OrderedTS编码方法,解决了可能存在的训练集与测试集中存在条件偏移的问题,同时解决了过拟合的可能性,使模型的准确性和可靠性更稳定。具体公式表示为:
(6)
(3) LightGBM
在提升决策树的基础上优化的LightGBM算法,具有更快的训练速度、更低的内存消耗、更好的准确率、支持分布式可以快速处理海量数据等优点,通过保留梯度较大的数据,在梯度较少的数据中随机取样,减少了数据集分布带来的影响,同时将多个特征进行整合,减少特征数量,提高模型的准确性和可靠性。相比于Xgboost和Catboost,LightGBM在效能和内存上有决定性优势。
(二) 资产配置理论
(1) 等权重配置
等权重投资是一种较容易的投资组合构建策略,赋予投资资产相同的资金权重,若存在n个资产,则每份资产投资的资金比例为
,这种基准投资组合会定期进行权重调整,易于实现,避免估值误差。
(2) Black-Litterman模型
Black-Litterman模型以所选资产投资组合的均衡权重作为基础,将经由历史数据计算出的均衡收益率作为先验期望,后将投资者的主观观点作为增量信息,以此计算并确定后验权重与收益。它的优点主要体现在两个方面:模型以市场均衡组合为起点,因此结果的稳定性大幅提高,配置结论往往更贴近投资者的直观认知;投资者可以更灵活的表达对资产的主观观点,例如可以只对部分资产发表观点。其后验收益的期望与协方差阵如下:
(7)
(8)
其中,各参数如表2所示:
![](Images/Table_Tmp.jpg)
Table 2. Black-Litterman model parameter annotations
表2. Black-Litterman模型参数注释
Black-Litterman模型的先验分布的效用函数表示为
(9)
其中,w为资产配置的权重向量,
为风险厌恶系数,当没有主观观点时,w接近于CAPM模拟的市场
均衡权重,记
为投资组合内n个资产的收益率向量,假定
。
是随机变量,且
以市场均衡收益率Π作为期望,以
作为协方差阵。其中
越小,代表主观观点所占比例越小。将
用如下形式表示:
(10)
其中
服从均值为0,协方差矩阵为
,
服从如下分布:
(11)
在得到先验分布后,加入主观信息,当投资者有i个观点,j个投资资产时,设P为一个为(i × j)的矩阵,则矩阵P的行向量为观点向量,矩阵P中的元素代表着主观观点中对应的资产收益率的对应资产的相对或绝对收益方向,并不包含具体数据。设Q为n个主观观点中具体收益率的期望,则Q为一个(i × 1)的向量,设Ω为主观观点的协方差阵,可得Black-Litterman模型中的增量信息为:
(12)
其中
服从均值为0,协方差矩阵为Ω,则主观观点的条件概率分布可以表示为:
(13)
根据贝叶斯公式经计算可得到后验收益率
的分布,
,将其带入均值–方差模型可得:
(14)
(3) 最小方差模型
最小方差模型是从均值–方差模型的基础上衍生得到,若存在一个包含n种资产的投资组合p,每
个资产在投资组合中的权重为
,并满足权重之和为1,即
,设该投资组合单个资产的收益率和预期收益率分别为
和
,因此,可以计算出该投资组合的风
险水平及预期收益率
(15)
(16)
其中,
代表了投资组合的风险水平,
表示
与
的协方差,均值–方差模型的公式如下:
(17)
(18)
根据这个模型分配资产权重时,只需要评估资产之间的协方差矩阵即可。
(4) 风险平价模型
风险平价模型的主要思想是在不同资产间实行风险分配,确保不同资产对总体风险的贡献相等,对于包含n种资产的投资组合,总体风险可以表示为
,其中Σ表示不同资产的协方差矩阵,
表示资产的权重向量,令第i个资产的边际风险贡献率为:
(19)
风险贡献度为:
(20)
理论上,当
,即可求出
,但实际应用中权重为非负值且权重之和等于1,
使用这种方法无法求出最优解,因此转换为如下公式的优化问题。
(21)
(22)
4. 数据说明
(一) 基金业绩指标
收益类指标选取了基金的净值收益率,考虑到数据的可得性,本文添加了济安金信的基金评级数据,将基金的盈利能力纳入收益类指标中,共分为六个等级,分别用数字1~6衡量基金的盈利能力,数字越大,说明该只基金的盈利能力越强。风险类指标参考相关文献,选择了基金月度的振幅、涨跌幅,同时纳入主观指标,即济安金信对其抗风险能力的评级,同样采用1~6数字进行衡量。
(二) 基金经理指标
基金经理的评价指标,本文基于以往对基金经理的评价指标(如表3所示),选择了学历、国籍、任职年限以及择时选股能力,其中学历在博士及以上赋值为3,硕士赋值为2,本科赋值为1;中国国籍赋值为1,否则为0;任职年限以年为单位;根据评级机构对基金的评价,选择择时选股能力作为对基金经理能力指标的判定。
![](Images/Table_Tmp.jpg)
Table 3. Comprehensive evaluation indicators of the Fund
表3. 基金综合评价指标
5. 实证回测
(一) 调参
采用sklearn网格搜索对数据进行调参,以月度收益率为例作为因变量,其余变量进行模拟,对所使用模型的调查结果如下表4所示:
![](Images/Table_Tmp.jpg)
Table 4. Ensemble learning model tuning
表4. 集成学习模型调参
(二) 模型选择
本文数据来源于瑞思数据库,以2013年~2020年的基金月度数据作为模型测试样本,以2020年~2022年三年的数据进行预测,并与基金经理数据进行匹配,最终产生有效样本量为1318份。分别采用Xgboost,Catboost和LightGBM集成模型对数据进行回测,以均方误差(MSE)来评价模型的预测效果,MSE的计算公式如下:
可得到回测阶段不同集成模型的均方误差,从月度收益率、季度收益率和年收益率上看,Xgboost集成算法的预测误差较小,因此可以认为Xgboost预测效果较准确。相比于Catboost模型可能存在的条件偏移问题,Xgboost模型具有较好的预测稳定性,并且,在应用成熟度上,Xgboost具有比LightGBM更广泛的应用范围,通常被应用于企业风险违约、股票市场投资和债券市场投资等方面。结合本文的研究内容以及均方误差(MSE)的结果(如表5所示),本文后续都将采用Xgboost模型对基金收益率进行预测并从大到小排列,选择月收益率最大的三只基金进行不同权重配置的投资策略。
![](Images/Table_Tmp.jpg)
Table 5. MSE metrics for integrated models
表5. 集成模型的MSE指标
采用Xgboost预测基金的月收益率,排序后以季度为周期进行投资,每季度选择的基金如下表6所示。
根据选出的基金收益率数据导入等权重配置模型、Black-Litterman模型、最小方差模型和风险平价模型,与市场指数组合的收益率进行对比,从图1中bl表示按Black-Litterman模型计算出的权重进行投资的组合策略,market代表沪深300与国债指数按8:2的比例进行组合的策略,ave表示等权重配置的投资组合策略,min_var表示最小方差模型的权重比例投资的策略,risk_mean表示按风险平价模型的权重配置的投资组合策略。从不同基金投资组合策略的收益率结果来看,使用Black-Litterman模型与风险平价模型的资产配置策略具有超越市场指数的投资收益,并且,在基金指数整体下行的趋势下,仍能够获得较好的投资收益,说明在纳入基金经理的业绩评价指标结合Black-Litterman模型的投资组合策略,能够获得较好的回报。而最小方差模型和等权重配置的模型并未表现出较好的收益表现。
![](Images/Table_Tmp.jpg)
Table 6. Xgboost screening fund
表6. Xgboost筛选基金
![](//html.hanspub.org/file/367-2310754x66_hanspub.png?20240606104500757)
Figure 1. Fund investment strategy yield
图1. 基金投资策略收益率
6. 结论与展望
本文引入基金经理业绩指标,旨在构造出相较于基金普通业绩评价体系更有效的评价体系,特别地,结合目前基金市场的趋势,加入基金经理个体特征的主客观指标,并对其量化。通过集成学习进行收益预测与基金选择,并以其预期收益率对Black-Litterman模型进行优化,最终以4种资产配置模型(等权重模型、风险平价模型、最小方差模型、基于集成学习优化后的Black-Litterman模型)构造投资策略并进行回测,对比两评价体系下各投资策略的各项指标得到了如下结论:集成学习模型中,Xgboost对数据的预测效果较好,使用Xgboost进行基金收益率预测并使用四种资产配置模型(等权重模型、风险平价模型、最小方差模型、基于集成学习优化后的Black-Litterman模型)进行投资,发现Black-Litterman模型与风险平价模型具有较好的收益回报,而等权重模型、风险平价模型并不能带来超过市场指数的收益。
在实证研究的过程中,仍存在许多不足有待进一步完善,主要可以从以下几个方面继续深入研究:(1) 在引入特征指标时,可以考虑更多的指标例如:舆情因子、宏观因子、持仓集中度、基金自身评级等,使评价体系更为完善全面。(2) 在刻画基金经理特征的量化过程中,对口专业背景变量的分类判断过于主观,在后续研究中可通过自动化方法进行基金类别与专业的词频匹配,进一步判断是否具有强专业相关性。(3) 在判断集成学习模型的优劣中,本文是以MSE为唯一标准,后续可以考虑更多参数如MAE、RMSE等。(4) 在基金调仓方面,本文调仓策略频率较低,为季度调仓,未来提高调仓频率,进行月度调仓或周度调仓等。(5) 在回测中,2020~2022区间相对较短,且处于疫情期间具有一定的特殊性质,此时行业主题基金正处于风口之上,后续改进可将回测周期拉长,尽量穿越完整的牛熊市。