1. 引言
人工智能(AI)是计算机科学的一个分支,它能够通过“思考”的方式解决问题。在过去的二十年里,人工智能经历了快速发展,已经成为了一种通用的技术,并且广泛应用于包括金融在内的各个行业领域。
如今,AI毫无疑问已经成为了各行各业在进行数字化转型进程中的关键重要工具。“AI+”这一模式更是行业科技化发展所展现出的核心特征。随着AI技术在各个行业场景的落地,人工智能与工业、商业、金融业等众多行业实现了全面且深度的融合。这种融合犹如一股强大的推动力,不断促使经济形态发生演变,从而为社会经济实体注入了源源不断的活力。
本文将梳理人工智能的发展历史,在金融行业中的应用场景、应用现状,并探讨后续AI在金融行业的发展方向。后文第一部分整理AI发展历史,第二、三部分阐述AI在金融行业中的发展及现状,第四部分阐述AI在金融行业所面临的挑战,第五部分探讨AI在金融行业的展望,最后是本文的结论。
2. AI技术概述
人工智能(AI)从20世纪50年代提出到现在,发展已经有70年的时间,从最开始学术界的概念到如今已经有无数的人工智能应用落地到各个行业场景 [1] 。提出了人工智能的愿景,其中包括创造可以像人类一样推理、学习和交流的智能机器。这一愿景引发了该领域的研究和创新浪潮。
在人工智能发展的初期,科研人员利用一些规则,使得机器能够通过预设的一些答案或者话术回答一些人类提出的问题与人类进行交流,这也就是早期的自然语言处理NLP。在同一时期,学术界提出了感知器算法(Perceptron),这种算法就是后面深度学习、神经网络的雏形 [2] 。
在上个世纪80年代,人工智能发展出了“专家系统”,一些行业专家提供专业的知识,将知识存储到数据库中备用。当用户进行提问的时候系统通过一些规则去数据库中匹配答案并返回 [3] 。总的来说“专家系统”依然是沿用了之前的规则策略,而并不是我们今天意义上的人工智能算法,但是这种系统为后面人工智能的发展提供了非常大的启示作用。
20世纪80年代,人工智能领域中的机器学习也迎来了发展。多层感知机,决策树,boosting算法,bagging算法,svm算法都迎来了自己的春天。这些机器学习算法都可以从已知的数据中学习到统计相关的规律,然后将这些泛化到全部的数据中 [3] 。从技术层面上讲,已经摆脱了规则策略的范畴,而真正的走向了智能。
21世纪,随着互联网和大数据时代的到来,收集的数据从原先的几万,几十万,迅猛增长到百万,千万,亿等级别。人工智能也相应地得到了进化,进化出了深度学习。相比于机器学习,深度学习可以利用更多的数据,训练出更为复杂的模型,在相同问题上面,深度学习的泛化性能,准确率都要比机器学习提升了很多。
近些年,Transformer的崛起将深度学习带到了一个难以企及的高度,通过Transformer架构,利用全网数据可以训练出了参数规模在千亿级甚至是万亿级的大模型,将人工智能又带上了热门话题 [1] 。
AI技术的发展呈现出层层递进的趋势。最开始是以简单规则策略应用到实际场景中,进而发展出算法模型,接着从简单模型进化成复杂模型;与此同时,应用数据量也逐步变多。随着这些方面的发展,人工智能的性能在逐步提升。
3. AI在金融行业的发展历史
人工智能在金融行业中的应用可以追溯到20世纪60年代末,第一款量化基金在美国成立,后续80年代,国外金融机构部署的是基于规则策略的专家系统。通过专家系统来执行各种功能,比如自动交易,对冲基金,投资交易部门还有风险分析等。早期的这些人工智能系统基于预先的规则集,通常由金融专家或者是交易专家来进行开发。
在20世纪90年代,随着人工智能的不断发展,机器学习、数据挖掘等算法应用到了金融行业中。机器学习算法并不是根据专家开发的规则来决定输出结果,而是基于金融行业数据,通过算法学习金融行业的统计规律和模式,给出后续的输出结果。在实际问题上,以金融风控领域为例,机器学习能够处理大量复杂的数据,自动发现数据中的隐藏模式和规律。例如,通过分析大量的交易数据、客户信息等多源数据,可以识别出一些异常的交易行为或潜在的风险模式,这对于防范欺诈、信用风险评估等方面非常有帮助。比如在信用卡交易中,机器学习模型可以根据用户的消费习惯、交易地点、交易金额等多维度信息,快速准确地识别出异常交易,如突然在异地的大额消费等。
2010年后,随着大数据时代的到来,金融行业积累了大量的行业数据,深度学习也被引入到金融行业中,通过大量数据训练的深度学习模型要比普通的机器学习模型效果提升了很多。人工智能在金融行业应用层面,也有所扩展,量化交易,投资组合,市场趋势预测,交易全链路异常检测(授信,限额评估,交易,支付)等等。
近年来,ChatGPT的问世,象征着以大语言模型为典型代表的新一代人工智能即将引领一场全新的科技革命与产业变革 [1] 。大语言模型技术极大地增强了认知能力、推理能力以及语言能力。在大模型技术尚未出现之时,人工智能在金融行业的应用主要面向专业人士或者金融行业的从业人员,借助模型或者策略为专业人士在决策方面提供辅助,以提高工作效率。例如在股票市场中,人工智能能够为从业人员提供一些市场信号,告知他们何时买入、何时卖出等。然而,大模型技术降临之后,更多的金融行业应用场景应运而生,像智能金融顾问,大模型技术能够面向C端用户开展金融行业的知识问答等服务。在实际应用中,大语言模型并不是孤立地应用在各个场景,而是多种技术相互结合使用,通常与大模型结合使用技术包括智能体,知识图谱,知识库,基础模型等。大模型负责意图挖掘,智能体负责流程调度、决策,知识图谱负责意图增强,知识库负责知识检索,基础模型负责提供专业能力。
AI在金融行业中的发展脉络基本与AI技术发展的趋势相同,早期都是用专家策略体系来驱动业务场景,随着机器学习,深度学习,大数据等技术的崛起,这些技术也应用到了金融行业之中。近些年大模型的出现,同样在金融行业中也掀起了产业变革。只不过在早期的适合金融业界与学术界间隔的时间比较久,而现今的大模型技术出现了不到5年的时间,已经被广泛地用到了金融行业中,而且迭代的速度越来越快。
4. AI在金融行业的应用现状
4.1. 量化交易
说到人工智能在金融行业中的应用,首先避不开的就是量化交易。借助算法、模型等现代统计学、数学方法和计算机技术,通过对大量交易历史数据进行分析建模来确定交易时机、价格数量等关键要素,以实现更稳定高效的投资汇报 [4] 。
上个世纪80年代,国外就已经成立了成熟的量化交易基金,90年代,利用机器学习算法和金融数据来设计建模。在国内这种量化交易技术在21世纪初才出现在国内股票市场,而同时期全球量化交易基金规模已经突破了1万亿美元,国内在量化交易方面起步较晚 [5] 。目前国内的量化交易水平与美国可能存在10到20年的差距。
人工智能在量化交易中的应用涵盖股价预测、因子挖掘和异常交易检测。其中股价预测是利用历史市场交易数据来预测未来股价走势;因子挖掘则借助算法模型和现有市场因子(指标),挖掘因子间关系以生成可作为判定市场走势指标的新因子(指标);异常交易检测是通过监控交易数据并利用算法模型来检测如内幕交易、操纵市场等异常交易活动 [4] 。
整体而言,量化交易以金融行业的交易数据、财务数据以及宏观经济数据作为数据驱动的基础,运用人工智能技术(包含算法模型和策略)进行智能决策,并且借助计算机程序实现策略的自动化执行。
4.2. 智能风控
智能风控已成为人工智能和金融领域融合的热点之一,借助人工智能技术,进行数据收集、行为建模、用户画像等,从而协助金融机构进行风险识别和防范。相比于传统风险管理及合规,智能风控更为轻量化,不需要庞大的风控部门,只需要搭建技术风控中台和少量部分的业务风控从业人员就可以为金融机构或者大公司提供良好的风险控制能力 [6] 。
在当今金融领域,人工智能技术在风险控制方面已经取得了部分成果,大量的科技和金融类企业纷纷开展布局。例如百度的“昊天镜”风控系统,作为风控中台为百度的各个场景提供风控能力,同时对外部公司或者金融机构提供风险标签,提升风控的效果。
从具体应用看,智能风控已在信贷、保险,支付安全等各领域中开展应用 [6] 。在信贷领域中应用的智能风控大多集成中台部门,通过人工智能生成信用标签信用分。以银行的信贷风控为例,智能风控可以应用到贷前、贷中、贷后全流程,贷前进行智能信息核验和信用评估,贷中进行实时监控、动态风险预警,贷后进行自动催收等。保险领域中,智能风控主要用于骗保检测与智能理赔,提高欺诈识别率、降低理赔时的人工成本,提升理赔效率,降本增效 [7] 。在支付领域,智能风控主要用于异常交易检测,黑产洗钱挖掘等,借助用户画像,支付方式,交易链路,挖掘交易订单中的异常情况,并且可以挖掘部分涉嫌洗钱的交易行为,进行线下打击 [8] 。
总体看来,人工智能技术在金融风控领域的应用相对广泛,相比于传统的风险控制,人工智能技术可以根据金融数据、支付数据等快速地学习到内在逻辑,并且进行泛化识别风险,降低人工介入进行审核的程度,对新型风险的识别速度也要明显快于传统风险控制。
4.3. 智能金融顾问
2017年,谷歌提出了Transformer架构,颠覆了以往的神经网络结构,借助注意力机制增强了模型的语义理解能力 [1] 。在Transformer出现之前,受限于模型结构以及训练速度等因素,自然语言类模型,例如RNN、LSTM等模型,无法达成大规模的预训练。Transformer架构成功化解了这一难题,算法专家能够凭借大量非结构化数据的预训练,让模型学习到语言当中的语意。自此,大规模预训练语言模型也因其在机器翻译、智能问答等多项任务中的出色表现,逐渐被人们所关注。
近年来,大语言模型也在金融行业中也有广泛的应用,其中金融顾问类的应用(智能投顾)最为突出。智能投顾利用人工智能、大数据和云计算等技术的服务决策系统,为投资者提供投资建议等服务 [9] 。传统人工投资顾问无法掌握全部的金融投资知识,只能针对自己熟悉的领域给投资者一些通用建议,而智能投顾可以利用大语言模型理解客户的需求,并且结合用户自身的特性给出个性化的建议,可以做到千人千面。
市场中智能投顾服务产品分为面向用户和面向企业两类。面向个人用户的产品,发展较成熟,主流互联网金融科技公司、银行机构都会有智能投顾服务 [6] 。例如蚂蚁金服在自己的APP支付宝上面集成了智能金融顾问服务,可以根据用户的需求,用户画像,市场行情,以及金融行业产品,给用户推荐个性化的金融产品,比如理财,保险,基金等。同时还包含了其他的一些能力,比如金融问答,保险问答,保险理赔等等。面向企业为传统金融机构提供解决方案,能降低机构成本,使其专注核心环节,但目前尚处萌芽阶段。
目前在金融行业中,大模型的应用并不是独立的,而是结合了很多其他的功能一起来服务于业务。以智能投顾为例,金融投顾是应用场景,下面会有一个智能体作为接入,负责整体任务的编排,调度,整合,接口管理等。大模型是智能体调度中的一环,主要负责用户理解和意图识别,根据识别到的意图进行后续的流程编排。金融知识库,存储大量的金融行业知识,当用户进行提问的时候,大模型根据用户的问题进行理解,智能体根据理解来金融知识库中进行检索相应的答案并返回。
在智能金融顾问应用场景中,人工智能已经不是用单一的技术来提供能力,而是结合了多种技术的一个人工智能体来解决复杂问题。相比于传统的人工智能算法模型,只能解决相对单一的问题,多种技术融合成的人工智能体能解决的问题范围更广,链路更长,泛化问题的能力也相对有提升。
5. AI在金融行业面临的问题与挑战
人工智能在金融行业的发展呈指数增长,在未来的几年以及十几年间会造就众多的机遇。机遇与挑战并存,人工智能在赋能金融行业的同时,也会带来相应的问题与挑战。
5.1. 数据挑战
金融行业在数据获取方面相较于其他行业具有一定优势,能够获得大量的数据,涵盖金融市场数据、公司财务数据、宏观经济数据以及金融舆情数据等。然而这也带来了一系列的挑战。
首先就是数据种类和格式繁杂且不统一,缺乏一个通用的标准格式。比如金融市场数据基本都是结构化数据,而公司财务数据很多都是非结构化的文本数据,难以进行管理。获取大量数据的同时,数据质量问题也不容忽视,数据缺失、数据偏差、数据错误都会对人工智能模型训练效果以及准确率产生严重的负面影响。数据缺失可能导致模型无法全面捕捉信息特征,从而使预测出现偏差或不完整;数据偏差会使得模型无法优化到全局最优,在应对特定样本时产生错误的预测;数据错误则可能直接干扰模型的计算和分析过程,让模型无法进行预测 [3] 。
其次,尽管数据量丰富,但是部分数据无法直接用于人工智能模型的训练和预测。大部分人工智能模型需要结构化数据来进行训练预测,而金融行业中存在大量的非结构化文本数据。非结构化文本可以在大模型的训练中提供作用,但是文本中包含的金融数据信息却无法被大模型提取,需要将这些信息转换成结构化数据,由机器学习、深度学习模型来进行学习。
5.2. 模型可解释性问题
人工智能最初兴起的时候,金融行业中主要应用的是基于规则的人工智能系统,这些系统基本由专家制定规则,简单透明,但是缺乏灵活性,泛化能力较差,难以适应复杂多变的金融市场 [10] 。
为了克服泛化性低的问题,金融行业引入了机器学习,深度学习模型,但是模型带来了“黑盒”问题,即数据输入模型后,其输出决策的过程难以理解,计算过程复杂繁琐且缺乏可解释性 [10] 。虽然可以采用解释性较强的线性回归模型和决策树模型,但这些模型的准确率往往不如神经网络等复杂模型。由于部分机器学习模型的结果不具备可解释性,在某些领域如风控领域使用机器学习模型依然存在疑虑。
尽管在某些场景下,对人工智能的可解释性并无要求,但一些监管机构可能会要求金融机构给出清晰且可理解的决策解释。同时,模型的可解释性能够使机器学习和深度学习模型更加透明,有助于经济学家和金融从业者理解模型的决策过程。
5.3. 监管问题
金融领域的人工智能系统迅速扩展,可能会给用户带来一些问题。比如在金融投资顾问场景,人工智能可以给用户推荐金融产品,但是由于准确率无法达到100%,用户会有被人工智能误导的风险。所以在金融行业对人工智能监管是很必要的,确保人工智能系统能够作出公平合理的决策,增强金融市场的公信力。
除了对人工智能系统本身的监管,还要对人工智能使用的数据做监控。确保数据使用的必要性、安全性、合法性。目前有一些人工智能比如大模型会根据用户的历史行为,个人信息进行个性化服务,可能会涉及滥用个人隐私信息等风险 [11] 。
目前在国家层面已经制定出台了《“人工智能+”推进新质生产力发展的总体法案》,为“人工智能+”赋能新质生产力发展提供顶层制度设计,并且还参考了欧盟的《人工智能法案》完善人工智能监管国家立法。针对不同人工智能技术采取分层、分类、分级、分步的治理办法,而不是一刀切地进行监管 [12] 。
6. AI在金融行业的未来发展及展望
6.1. 技术发展趋势
结合AI发展历程以及其在金融领域的发展进程可知,人工智能技术始终处于迭代进程中。早期以专家系统为起点,逐渐发展至人工智能算法模型,在此过程中不断优化泛化能力,能够从历史数据里汲取知识。接着从机器学习模型过渡到深度学习模型,应用数据量也从少量拓展至大数据层面。近期大模型在金融行业成功落地,融合多种模块功能,实现了从单一任务预测判断到行业通用任务模型的转变。
由上述金融行业中人工智能技术的演变可以进行合理推断,在未来人工智能将会集成多种模型,策略来进行部署落地,通过具备可调节性的流程编辑将多种模型算法、策略串联起来,从单一的模型转变为“模型策略复合体”。当前大模型的应用落地主要围绕大语言模型进行布局,由智能体调度知识库、知识图谱以及小模型来完成特定任务,现阶段除模型外,智能体调度基本遵循固定流程。而未来的智能体可能会转变为可学习式的流程编辑智能体。当面对不同任务时,智能体能够自行调节任务调度流程,使其自身变得更加智能,泛用性更强。
6.2. 数据发展趋势
在数据层面,早期专家系统阶段,主要依靠专家对部分核心数据进行人工分析;接着在机器学习、深度学习模型能够利用大数据进行训练,学习数据之间的关系;到如今大模型阶段,已经可以利用全网大数据开展预训练微调。从数据量来看,经历了从少量数据到大数据的演变;从数据类型而言,从单一类型数据发展到多类型结构化数据,再到非结构化数据。展望未来,人工智能在利用数据方面将会把结构化数据与非结构化数据相结合进行知识学习。
由此可推断,后续必然会发展数据能力,包括数据采集,数据管理,数据处理等能力,实现对数据的分类管理与分类处理,同时也会开发多层次的数据处理流程,数据在采集的同时进行分类加工,分层加工然后进行存储,方便后续用于模型训练。
6.3. 业务发展趋势
金融业务的覆盖领域极为广泛,涵盖银行、券商以及各类金融机构等。AI在金融行业的业务场景起初聚焦于券商和金融机构的量化交易业务,而后逐步拓展至金融风控以及金融咨询等领域。由此清晰可见,人工智能服务的范畴在持续拓宽,从服务专业人员起步,延伸至金融从业者,再到普通的金融用户。据此能够推断,人工智能在金融行业业务发展将提升全人群中的覆盖比例,从金融用户扩展到普通人。例如,后续人工智能或许会在金融支付领域重点发力,像面向用户端的支付安全等业务场景就是潜在的发展方向,使每个人都能感受到人工智能在这个方向带来的安全便捷。
6.4. 应用发展趋势
在对人工智能于金融行业中的应用进行剖析时,可从两个层面展开探讨。
其一,针对专业人员的应用发展走向。以量化交易为例,在面向金融市场制定交易策略方面,未来将朝着更具专业性的方向迈进。一方面,会逐步借助更为复杂精密的模型来处理各类任务,以此提升交易决策的准确率;另一方面,还将运用模型解释性技术来增强模型决策的透明度与可解释性。人工智能将作为专业人员强有力的辅助,出现在各个金融专业领域中,提升专业人员的效率以及能力。
其二,关于面向通用人员的应用情况。以智能金融顾问为例,其主要面向普通用户解答金融疑惑并推荐投资策略。人工智能在此领域会朝着更宽泛的方向发展,通过更为繁复的流程来应对复杂问题。从当下智能体的应用现状就能发现,处理复杂问题已不再局限于单一模型,而是整合模型、策略以及规划等多种方式协同解决问题。同时,其发展趋向很可能从智能金融顾问逐步进化为能够为每一位用户提供定制化服务的千人千面的个人金融管家 [13] 。
7. 结论
人工智能在金融行业已经发展了近60年的时间,这段时间内人工智能在金融领域经历了显著的发展与变革。金融机构和金融从业者如果可以洞察到人工智能在金融行业的发展方向,提前布局,调整基础架构,优化资源配置,储备相关方向人才、知识、数据、硬件资源,就更有可能抓住潜在的机遇,在激烈的市场竞争中抢占先机。