这是一个以大模型为核心的人工智能新时代。
人工智能技术正在积极赋能千行百业。相比通用大模型,针对特定行业训练的大模型在垂直领域的智能交互中表现更佳。一个典型的例子是,彭博推出的大模型Bloomberg GPT在实时的金融数据处理等方面超越了ChatGPT,展现出了更强的专业性。
原因何在?以大模型的三大核心战斗力(算力、算法和数据)来比较的话,若论算力层面,ChatGPT可谓是碾压式的存在。根据公开信息,GPT 3的参数高达1750亿,市场预估,GPT 4的参数至少可达万亿级别。而Bloomberg大模型的参数为500亿。
答案落脚在了算法和数据层面。
“行业大模型强调两项关键能力:算法调优与行业积累。”百融云创CEO张韶峰在近期的投资路演中分析道。
作为垂直类金融AI头部平台,百融云创(百融云-W,6608.HK)近日完成了AI大模型BR-LLM的升级。此次升级不仅增强了大模型的预测精度和响应速度,同时通过底层机器学习算法调优,大幅度提高了模型的普适性,适应不同金融场景的定制化需求。
中国金融版大模型的内在机理
与彭博大模型理念相一致,百融云创的AI大模型可视为中国金融版的GPT模型。
据了解,BR-LLM同样是建立在Transformer的架构之上,利用深度学习中的多头注意力机制拟合人机交互方式,从而能在复杂交互中实现强大的处理和应答能力。
与通用大模型不同的是,BR-LLM由多元化的AI组合策略驱动,这其中既包括分析、判别与预测算法,也包括生成式算法(AIGC),另外还有智能交互等技术。
对此,张韶峰解释道,对于金融行业来说,仅仅依赖生成式AI并不能满足所有的需求。他称,在信贷、财富管理、保险等业务领域,需要判别型算法进行智能分析和决策制定;在智能运营、精准营销等业务领域,则高度依赖AIGC来帮助金融业降本增效。
一个例子可以说明判别类算法对于金融领域的不可或缺性。几年前,一家知名银行遭遇团伙欺诈,犯罪分子利用虚假信息成功绕过银行的信用检测,批量申请贷款,短短一天之内,这家银行被骗走10亿资金。
这是一则教科书式的金融欺诈启示录。它不仅带给金融业以长足的警醒作用,也令判别式AI的技术力量更加深入地与金融场景融合。
“垂直行业AI大模型的内在机理既着重于通用的自然语言处理(NLP)和AIGC技术,也要基于行业特色结合其他算法。这样的大模型设计思路能够更精确地理解和满足行业的复杂需求,提供更高效和定制化的解决方案。”张韶峰总结道。
模型调优,大幅提升运营效率
据张韶峰介绍,尽管BR-LLM融合了不同类型的AI算法,但其底层技术本源是相通的,既依赖于深度神经网络和注意力机制构建的自动机器学习建模平台。
撑起百融云创营收的三大业务板块——智能分析与运营、精准营销及保险营销均蕴含了AI算法。特别是智能运营业务线,集纳了判别式AI算法、AIGC和实时智能交互算法,该业务线也是百融云创近几年增长最快的分支,财报显示,该业务线营收在2022年同增144%,今年一季度同比增长达68%。
在张韶峰看来,对于AI算法的不断优化和调整成为公司提升业绩的关键因素。近几年,百融云创不断将资源向算法研发倾斜。截至目前,百融云创研发投入已经超过14亿元。
以判别式AI算法来说,张韶峰称,其背后蕴含一大技术利器:即由知识图谱和机器学习构建的复杂关系网络。
在模型优化上,张韶峰将其形容为“用算法对抗算法”。简单来说,是构建一个“对抗性”的生成网络,同时结合生成式的建模平台和判别式的虚假信息识别能力。伴随模型性能的不断提升,可以毫秒级反馈交易反欺诈场景,对欺诈风险识别的准确率接近90%。
除了信用评分和欺诈检测,百融云创在针对智能交互的模型算法上也在不断精进。百融云创智能语音机器人(Chatbot)是AIGC技术在金融领域中的一项重要应用。与通用大模型不同的是,百融云创Chatbot不仅仅是文本之间的交互,而是集“文本+语音”于一体的多模态交互模式。
根据张韶峰介绍,一次完整的智能语音机器人交互过程是:“用户画像-生成初始文本-合成语音反馈用户-ASR分析语音并转化成文字-NLU实时处理文字生成语音。”如此循环往复。
“经过反复训练,目前百融云创智能语音机器人可以连续对话20—30轮不卡顿,且对于客户的语音识别准确率能达到99%以上。”张韶峰说。
行业know-how对抗“机器幻觉”
据了解,百融云创智能语音机器人每日的交互规模在业内位居首位。这一成绩的达成,除了技术优势之外,张韶峰认为,专属语料库的精心“喂养”也起到了决定作用。“除了优化算法,深度的行业洞察也是垂类大模型不可或缺的。”
这也符合主流的研判观点。业内对此有个形象的比喻:如果说算力是AI的“石油”,那么,数据便是“矿井”。
分析普遍认为,行业语料的培育可以对抗一些通用大模型存在的“机器幻觉”弊端,即大模型自信满满地给出若干错误信息。
能做到对抗“机器幻觉”,与百融云创历时九年深耕金融行业的点滴积累分不开,截至2023年3月末,百融云创在中国累计为超过7000家金融机构提供服务。同时,国内金融行业数字化转型步伐提速也为其提供了良好的发展土壤。
而为了用好行业语料,百融云创突破性将云原生平台与大模型深度绑定,再以MaaS(模型即服务)模式使得模型便捷地部署在不同的金融业务场景中。
在具体实现上,百融云创将金融和非金融行为信息生成为结构化标签,继而转化为直观和可操作的洞察,包括消费者信贷评估、精准营销、风险管理指标等,这些行业know-how通过百融云创的专有云原生平台嵌入金融业务流程中,从用户画像到贷款发起或保险承保,再到存量客户运营和贷后管理,全程无缝连接,有效解决从0到1的难题。
以智能语音机器人为例,百融云创自建SaaS云架构稳定性可达99.996%,可承载每天上亿次交互。在实时交互的同时,智能语音机器人还能够帮助机构筛选出具有潜在需求的客户,这些需求会反向“哺育”模型,自动生成智能质检报告。
再以金融反欺诈场景为例,百融云创的云原生平台可支持超大规模的图谱数据库调用,支持顶点和边的多度关系查询、聚类算法、连通查询等,从而保证时效性和准确性。
“丰富的行业洞察和积累会形成较强的护城河。”张韶峰说。