通用+金融VS金融垂类哪方更强
通用+金融VS金融垂类:优劣势对比
当前AI与金融的结合主要有两条技术路径:①通用模型+金融语料训练金融大模型,②金融垂类大模型。 由于设计和训练目的不同,通用语言大模型与金融垂类模型在优劣上具有相对性。通用语言大模型在泛用性、灵活性、数据利用率、迁移 性上相比金融垂类更有优势,而在专业性、针对性、高精度和合规性上,金融垂类模型更胜一筹;在复杂度问题上,通用语言大模型在结 构上更加复杂,影响模型效率,而金融垂类模型则是在更新维护上具有复杂性。
通用+金融VS金融垂类:通用金融训练超越金融垂类可能较小
使用金融数据对通用大模型进行训练,数据欠缺,成本过高。金融领域的语料应该充分覆盖各种金融产品、市场情况和业务流程等。但金 融领域的数据分散在各个金融机构,通用大模型缺少金融数据进行训练,金融专业知识不足;另外一方面,如果从底层开始训练大模型, 所需要投入的算力成本非常高,比如千亿级别的通用大模型,训练一次需要付出几千万的成本。
在特定任务上,精确性与适用性欠缺,需要更多优化与定制。金融垂类大模型通常会投入大量的时间和资源来收集和整理金融领域的专业 知识。这些专业知识包括金融术语、金融工具和金融法规等。通用语言模型虽然可以通过金融语料的训练来提高在这方面的理解能力,但 是否能达到金融垂类大模型的专业性仍有待验证。
金融领域要求实时性和高效的推理速度。金融领域的决策和分析通常要求实时的响应和快速的推理速度。金融垂类大模型可能会针对这一 需求进行了优化,以提供更快的响应时间。通用语言大模型在处理金融领域的实时应用时可能需要进一步的优化。
金融领域对合规性和风险控制要求极高。金融领域对于数据保护、隐私和风险控制具有严格的要求,专门训练的金融垂类大模型可能会更 好地满足这些合规性需求。
国内外通用大模型在金融领域应用表现
国内外通用AI大模型发展历程:国外领先,国内紧追
2023年6月国内AI大模型迎来爆发式增长,技术和应用不断发展,但与国外顶尖AI大模型尚有差距。 自2022年OpenAI发布ChatGPT以来,国内迅速形成大模型共识,开始追赶国外。目前各行各业开闭 源大模型不断出新,竞争形势越发激烈。
综合表现上,头部模型国外领先,平均水平国内外差距较小。在所有模型中,GPT4-Turbo遥遥领先, 国内最好的大模型为百度文心一言,但仍有15.77分的差距。国内方面,虽仍有差距,但在过去一年 内发展迅速,平均水平上与国外差距并不明显。此外,国内开源大模型在中文上的表现要优于国外 开源大模型。
通用大模型在金融领域应用表现各有差异
国外GPT系列在金融领域表现较好。GPT系列能较好理解金融术语,解答金融相关问题,且具备一定的实时性,在金融领域能够自动生成 金融报告、做市场研究、客服机器人等。
国内百度文心、阿里通义千问、腾讯混元以及科大讯飞在金融领域表现较好。百度文心一言具备较高的实时性,且金融术语的理解较好, 准确度高,能够在金融新闻分类、问答系统和智能写作中发挥作用。阿里通义千问能够较好的解释金融概念、提供一般性的金融投资分析 指导,但存在时效性限制。腾讯混元可以优化金融服务的个性化体验、市场情绪的追踪等。科大讯飞火星则将语音识别和处理技术用于交 易系统、智能财经助手等。
国内外金融垂类模型发展进程
国内外金融垂类模型发展历程:国外发展先行,国内成品问世
金融大模型始于2023年3月BloombergGPT,通过应用金融大模型,金融效率将得到大幅提升。彭博推出了为金融领域量身定BloombergGPT 模型,吸引了行业关注,大模型有了新的发展方向。金融行业沉淀了大量高质量数据。各金融平台的用户数以亿计,各种用户画像数据、 交易数据浩如烟海。利用大模型对上述数据的分析处理,可大幅提高金融效率。比如,金融机构可以预测用户行为偏好,更高效、准确评 估客户风险;AI还可以实时监测交易和市场波动,及时制定策略。
当前国内外金融行业都在主动拥抱大模型。IDC(国际数据公司)一项调研显示,超半数的金融机构计划在2023年投资生成式人工智能技术, 只有10%的金融机构表示没有试验计划。国外自BloombergGPT后,也出现了如FinGPT等一系列金融大模型。而国产金融大模型也已分出了 明显的两个“流派”。一派来自于传统金融机构,另一派来自于金融系科技企业或互联网企业。
国外金融垂类模型案例:彭博BloombergGPT
彭博BloombergGPT率先登场,金融任务表现远超通用模型。2023年3月底,彭博构建了迄今为止最大的特定领域数据集,并训练了专门用 于金融领域的LLM,开发了拥有500亿参数的语言模型BloombergGPT。该模型依托彭博社的大量金融数据源,构建了拥有3630亿个标签的 数据集,支持金融行业内的各类任务,彭博近40年来在金融领域积累的数据占比为51.3%,剩余的48.7%则来自于公开数据。训练结果表明 ,BloombergGPT的混合训练方法使其模型在金融任务上的表现大大超过了现有的大语言模型,而在通用场景上的表现则与之相当,甚至优 于现有模型。
彭博BloombergGPT相比于通用大模型有诸多优势。BloombergGPT模型对金融领域理解更为深刻,并借助其针对性强、来源可靠的金融数 据,提供了深度专业的分析能力,同时通过协助优化金融NLP任务,助力提升彭博终端数据的应用价值,开辟金融行业分析和决策的新可能 性。
国外金融垂类模型案例:FinGPT
FinGPT是由AI4Finance Foundation开发的一种专门为金融领域设计的语言模型。它的目标是为金融大型语言模型(FinLLMs)提供互联 网规模的数据,以此推动金融领域的开源发展。FinGPT采用以数据为中心的方法,强调了数据采集、清理和预处理在开发开源FinLLM中 的关键作用。通过支持数据可访问性,FinGPT渴望加强金融领域的研究、合作和创新,为开放金融实践铺平道路。FinGPT由四个基本组件 组成:数据源、数据工程、LLMs和应用程序。
国内金融垂类模型案例:东方财富奇思妙想金融大模型
东方财富深入AIGC、交互式AI等领域的研究,进一步巩固流量优势。公司已经陆续研发了东方财富金融数据AI智能化生产平台、多媒体智能资讯及互动平台系统 等多个人工智能相关项目,并在公司部分产品及服务中进行了具体应用。公司将继续紧跟AI技术发展前沿,不断加强AI能力建设,进一步强化自然语言处理、图像 处理、语音识别和多模态融合技术能力,并继续深入AIGC、交互式AI等领域的研究,完善内容生态构建,AI赋能提升用户各场景使用体验和服务能力,未来或创 造新的场景以挖掘客户全生命周期需求,进一步巩固流量优势并提高客户转化率。
东方财富加大AI研发技术投入,筹建人工智能事业部,重点推进金融垂直大模型研发应用。8月11日,东方财富公告称公司将整合业务及研发力量,组建人工智能 事业部。公司具备广泛的AI应用场景,且沉淀了大量有效金融数据,有望通过此次组织架构调整提升AI技术能力,未来将在AI+金融领域实现更大突破。
国内金融垂类模型案例:同花顺HithinkGPT大模型
问财升级,HithinkGPT大模型开启内测。2023年12 月6 日,同花顺开启了问财升级版的内测,底层已经升级为Hithink GPT 大语言模型,结合海量金融领域数据 和知识,通过自然语言对话,协助投资者进行标的选择、标的诊断、资讯解读、投资教学等全方位投顾服务。考虑到同花顺坐拥3000 万+月活流量,以及B 端产 品iFind 业务的快速增长,同花顺大模型有丰富的落地场景。
B端iFinD产品逐渐完善AI功能,AI开放平台提供多种AI服务。公司的iFinD产品实现了基于语音交互与智能搜索服务、机器阅读研报、研报知识图谱自动生成等 一整套智能化解决方案,技术实力和功能处于业内领先,预计iFinD+大模型结合基础功能补齐、性价比优势有望引领中期份额突破;同花顺AI开放平台目前可面 向客户提供短视频生成、文章生成、数字虚拟人、智能金融问答、智能语音、智能客服机器人、智能质检机器人、会议转写系统、智能医疗辅助系统等多项AI产 品及服务。
报告节选:
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
相关报告
金融行业专题分析:AI+金融大模型的两条技术路线.pdf
金融行业内部控制操作指引.pptx
金融行业在Internet时代如何完善自身发展.pptx
年中国供应链金融行业深度调研及投资前景预测报告.docx
金融行业信用管理概念.docx
金融行业特点.docx
AI人脸识别诈骗敲响金融安全警钟.pdf
AI搜索专题报告:怎么看Kimi的空间?.pdf
边缘AI行业研究报告:边缘AI硬件,引领硬件创新时代.pdf
人形机器人专题报告:AI驱动,未来已来.pdf
建筑行业2024年春季投资策略:新国九条催化央企市值国改,低空经济AI与铜矿有色弹性大.pdf