特稿|邹传伟:大语言模型在金融中的应用价值和应用策略
自2022年11月以来,以OpenAI公司的ChatGPT为代表的大语言模型在全球备受关注,各行各业都在讨论大语言模型的应用前景。本文分四部分讨论大语言模型在金融中的应用价值和应用策略:第一部分讨论大语言模型的功能,第二部分评估大语言模型在金融中的应用价值,第三部分讨论金融机构的大语言模型应用策略,第四部分总结全文。
大语言模型的功能
英国科学家斯蒂芬•沃尔弗拉姆2023年在《这就是ChatGPT》中对大语言模型的功能有准确描述。ChatGPT“首先从互联网、书籍等人类创造的海量文本样本,然后训练一个神经网络来生成‘与之类似’的文本。特别是,它能够从‘提示’开始,继续生成‘与其训练数据相似’的文本”。ChatGPT的文本生成是“对文本的合理的延续”,本质上是“根据概率选择下一个词”。ChatGPT成功的一大关键是使用了谷歌公司2017年提出的Transformer架构。Transformer架构可以用来识别和预测“反复出现的主题和模式”。除了自然语言以外,还包括图片的像素(这体现为Dall-E、Midjourney和StableDiffusion等应用)、编程代码(这体现为GitHubCoPilot),甚至乐谱的音符和蛋白质的DNA序列。
需要客观理解大语言模型的功能。第一,大语言模型不是通用人工智能。第二,大语言模型基于对自然语言的统计建模,也就是给定当前和过往文本,用统计模型估计接下来出现某个或某组单词的可能性,但不具备像人那样理解自然语言的能力。第三,大语言模型没有人类的意识、批判思维、想象力或创新能力,也不是基于因果关系。大语言模型尽管能从海量文本中发掘出一般人注意不到的关系,但这不属于创意。大语言模型的“创意”在文创、艺术等领域具有重大价值,可能帮助超越常规思考;但在以金融为代表的对严格性要求很高的领域可能产生非预期的结果。
大语言模型在金融中的应用价值
(一)金融中的两类信息
金融是一个高度由信息驱动的领域。金融资产定价、风险管理、资源配置和金融监管等的基础都是对信息的收集和处理。在金融市场的作用下,分散在全社会的信息,不管是公开的还是非公开的,不管是定量的还是定性的,也不管是历史信息还是对未来的预期,最终都通过市场参与者的交易行为而汇聚到金融资产价格中。
金融中的信息主要分为硬信息和软信息两类。硬信息一般以数字形式存在,是定量的,不含主观判断、意见或观察。软信息一般以文字形式存在,是定性的,主观判断、意见和观察是软信息的一部分,需要结合所处的语境来理解。这两类信息因为生成机制不同,适用不同的分析方法。这是理解大语言模型在金融中的应用的关键。
(二)分析数据信息的定量模型
对数据信息,金融分析方法可以概括为:可以使用结构化模型,也可以使用简约化模型,但都假设背后有数据生成过程;这个数据生成过程中包含一系列未知参数,也包含了随机干扰的影响;通过数据样本估计这些未知参数后,就能得到有预测效力的量化模型。数据生成过程的基础可以是由经济学理论给出的经济变量之间的关系,也可以是套利机制造成的金融资产价格之间的联动关系,但都不同于自然语言中“反复出现的主题和模式”。
分析数据信息的定量模型在金融研究和实践中使用得非常普遍。代表性例子包括:1.金融衍生品定价模型;2.资产组合优化模型;3.算法交易模型;4.量化风险管理模型,比如内部信用评级法和风险价值测算。与GPT-4多达1.76万亿个参数相比,这些定量模型属于“小模型",但可解释性强,信息密度高。
很大一类定量模型属于或接近于解释型AI。代表性例子包括:1.基于生物特征的用户身份验证和识别,比如人脸识别在远程开户中的应用,以及用指纹登录各种金融App;2.基于大数据的信用评级和投资者风险偏好评估;3.基于使用情况的车险精算定价;4.异常交易和欺诈识别。这些定量模型针对的都是模式识别问题,本质是将生物特征、信用资质、风险偏好、遇险概率和交易行为等进行分类。
目前,解释型AI在金融领域的应用范围远超过生成式AI。尽管以大语言模型为代表的生成式AI在金融中的应用会越来越多,这两类AI之间的搭配使用也会越来越多,但需要看到这两类AI之间的不同。特别是,分析数据信息的定量模型和解释型AI针对的这些问题,都不属于大语言模型的比较优势。
(三)文本信息和大语言模型
金融领域对高效处理文本的非结构化信息有很大需求。在大语言模型兴起之前,自然语言处理(NLP)在金融中已有一些应用场景。这些应用场景也将是大语言模型在金融中的主要应用场景,包括:1.查询信息和检索文档;2.对政策文件、新闻报道、公司公告、业绩发布会、研究报告和聊天记录等的文档解析和知识提取,以提高投资研究效率和广度;3.市场情绪分析;4.底稿生成和文档审核;5.金融素养教育;6.根据用户指令执行操作。
大语言模型将使文本信息更有效地进入金融市场,有助于解决在金融建模中文本信息输入不足的问题,提高金融市场效率。大语言模型从文本信息中提取的信号,可以作为定量模型的输入。比如,通过大语言模型对美联储新闻发布会、公开市场委员会会议纪要的解析,能为美国国债量化投资提供重要参考。
大语言模型的“对话”和“创造”能力,能将金融工作者从大量的简单、重复工作中解放出来,提高金融服务质量。大语言模型在信息查询,文档检索、解析和知识提取,研究报告和合同的底稿生成,计算机代码生成,文档审核,以及智能客服等方面可以成为金融从业人员的智能助手,帮助他们专注于更需创造力、更能为客户创造价值的工作环节。
(四)大语言模型应用于金融要考虑的特殊问题
第一,金融(特别是证券领域)对真实、准确和完整陈述有严格要求,虚假记载、误导性陈述或者重大遗漏会面临严厉惩罚。大语言模型存在“幻觉”问题。针对这个问题,一些金融机构结合知识图谱提高大语言模型输入结果的专业性,以及通过与专业人士的人机对话来提高人类反馈对齐的效率。
第二,金融对时效性的要求很高。分析数据信息的定量金融模型能做到实时抓取并分析数据,但很多大语言模型的训练语料是截止到某一历史时点。针对这个问题,一些金融机构使用向量数据库提高大语言模型训练语料和输出的时效性。
第三,数据安全问题。大语言模型本质上是针对文本语料的无监督学习。在训练、推理环节以及模型参数拟合中,是否会泄露金融机构的商业机密或用户的隐私数据?目前,本地化部署是普遍做法,以使数据不出金融机构。
第四,金融伦理问题。金融活动具有鲜明的价值维度,涉及人的基本权利。比如,公平获得信贷的权利,很难将金融决策完全交给算法来负责。大语言模型具有一定“黑盒特征”,在可解释性、可审计性和可追责性等方面有欠缺,这会制约大语言模型在一些金融场景的应用。解决方法一是人工智能的治理,提高透明度和可解释性;二是人的智慧和人工智能结合使用,特别针对涉及大量主观考量因素的复杂投融资决策。
第五,大语言模型的应用与现有监管法规的兼容问题。比如,如果通过大语言模型在互联网上向一般公众提供证券投资建议,这是否涉及证券领域对投资顾问的监管?
金融机构的大语言模型应用策略
目前,金融大模型主要是基础模型结合金融机构自身数据进行微调的产物。金融机构应该制定清晰的大模型应用策略,主要包括以下问题:第一,如何选择适合自身需求的基础模型?第二,如何进行本地化部署?第三,如何使用自身数据进行模型微调?第四,如何进行调试和校正?第五,如何进行人员培训,特别是培养提示词能力?第六,如何进行组织和流程改造,以发挥大模型的效力?
金融机构在制定和实施大语言模型策略中还需要考虑以下四方面问题。第一,基础模型只能由少数几家AI实力强的公司开发。假设多家金融机构使用同一个基础模型,在金融市场出现重大风险事件时,它们的大语言模型是否会给出相似建议,从而造成金融机构的一致行动并放大市场风险?
第二,训练语料的质量在很大程度上决定了大语言模型的质量。训练语料中包含的偏见会影响大语言模型的训练效果。训练语料中还可能存在虚假信息和样本选择偏差。比如,在“数字鸿沟”下,一些人群在互联网上留下的数据不多,在训练语料中的代表性不足。这是否会影响大语言模型服务这些人群的质量?需要看到,这些人群往往也是普惠金融工作的对象。
第三,大语言模型在金融机构风险管理、资本管理和监管科技中的应用,涉及大语言模型与前文所述定量“小模型”和解释型AI模型之间的关系,要各用其长,强强联合。首先,术业有专攻,大语言模型不构成对它们的替代。大语言模型的数学能力不强,计算成本比较高。其次,用大语言模型将一个复杂问题分解成不同子问题,每个子问题调用合适的分析方法,可以是“小模型”,也可以是解释型AI模型,最后由大语言模型把子问题的分析结果串联整合。
小结
第一,数据和文本遵循不同的生成机制,对数据的预测和对文本的合理延续适用不同的方法。解释型AI和针对数据信息的定量金融模型将继续在金融中发挥重要作用,大语言模型不构成对它们的直接替代,反而应该与它们结合起来用。在金融领域,大语言模型可以视为自然语言处理技术的升级,将使文本信息更有效地进入金融市场;大语言模型的文本“对话”和“创造”能力,能将金融工作者从大量的简单、重复工作中解放出来,提高金融服务质量。
第二,大语言模型应用于金融,要通过调试和测试以满足金融对真实、准确和完整陈述的要求,通过不断更新训练语料以满足金融对时效性的要求,还要妥善解决好数据安全问题、金融伦理问题,以及与现有监管法规的兼容问题。目前看,大语言模型还不适合一些需要仔细和严谨经济推理的应用场景。
第三,金融机构应该制定和实施清晰的大语言模型策略,包括基础模型的选择,本地化部署方案,训练语料的选择和数据安全保护,以及文本信息与数据信息、大数据与小数据、大模型与小模型的组合使用问题。
(作者系上海金融与发展实验室前沿金融研究中心主任、万向区块链首席经济学家)