自去年末开始,ChatGPT的横空出世点燃了AIGC(AI-Generated Content,人工智能自动生成内容)的发展热潮,相关话题热度爆发式增长,不少人士断言,人类社会已经步入人工智能2.0时代。
但是硬币的另一面,由AIGC引爆的大模型产业应用尚处于探索阶段,真正能落地的场景仍然凤毛麟角。一大技术挑战在于,以AIGC为基的内容生成并不总是可靠,甚至会毫无根据地做出错误判断。
“在垂直行业,生成式AI的局限性可以用决策式AI来补齐。”百融云创(百融云-W,6608.HK)CEO张韶峰说,AIGC带来了人机交互方式的创新,决策式AI则引入了质量控制机制,两相结合可以使得模型训练更为高效、精确,有效对抗“模型崩溃”、“机器幻觉”等弊端。
在垂直领域,AIGC为何不能“单独作战”?
在ChatGPT成为“当红炸子鸡”之前,业内对于以深度学习Transformer为框架的模型开发已经应用了很多年,直至ChatGPT将数据、算力、算法的阈值打到近乎满格,模型迸发出超强的“智能涌现”能力,使得AIGC接过了AI2.0的时代接力棒。
诚然,以ChatGPT为代表的生成式AI打通了若干智能围墙,但在垂直领域应用过程中,生成式AI模型的训练往往带有若干“偏见”。
以金融领域的信贷业务来说,生成式AI模型通过机器学习会生成一些事实性错误,例如,一个初入社会的年轻人由于没有历史信用记录,即便拥有稳定的工作和良好的收入来源,却被模型给出了“高风险”的标签。再例如,一位客户虽然收入很高,但存在过度消费等信贷风险,不过模型对其画像却是“低风险”。
这是因为生成式AI在权衡一些对冲性的信息时,不一定能做出正确的取舍。相比之下,决策式AI的决策树等算法则更擅长使用显性的逻辑规则来判断相互矛盾的信息,并能给出最优解。
“AIGC和决策式AI都在金融行业中扮演着重要的角色,仅仅依赖生成式AI并不能满足所有需求。”张韶峰说,在信贷、财富管理、保险等业务领域,需要决策型算法进行智能分析和决策制定;在智能运营、智能营销等方面,则高度依赖AIGC来帮助金融业降本增效。
谈及AIGC在特定应用场景中的局限性,张韶峰说,原因有很多种,例如模型训练的数据存在一定偏差,同时大模型又具有“黑箱”特性,在涌现行为出现的同时还存在“预测困境”。总之,模型与训练集耦合度过高反而失去了正确推理。
为此,作为AI云服务领航者的百融云创在传统决策式模型应用经验的基础上,结合生成式AI的技术特点,自主研发了AI大模型——BR-LLM,通过将分析、决策及预测算法与生成式算法以及智能交互等技术进行集成,可以改善大模型泛化的问题,并防止过拟合。
模型增强,如何让“1+1>2”?
据悉,百融云创在自主搭建大模型底层框架的基础上,预训练筛选出千亿tokens的高质量领域语料进行训练。通过深度微调,BR-LLM能支持百亿级参数,有效对接垂直领域复杂场景。
基于BR-LLM,百融云创构建了一系列数字化产品框架体系,内置集成了自然语言处理(NLP)、自动语音识别(ASR)和自然语言理解(NLU)等多种AI技术,并形成了决策式和生成式AI的协同工作模式。
“决策式与生成式AI的彼此补充、增强,可以极大提升AI大模型的准确性及对各种场景的适应力。”张韶峰表示。
以百融云创的知识图谱与LLM的协同强化为例。作为百融云创决策式AI的拳头产品之一,知识图谱旨在利用深度学习和图神经网络等机器学习算法,通过复杂模型抽取,将非结构化信息转化为结构化信息,从而可以发现隐藏的关系模式,并做出趋势预测和判断。
据了解,知识图谱可以在预训练或模型生成响应时整合进大模型中,同时也可以直接从大模型中蒸馏出知识图谱,即从模型生成的文本中进行价值提炼,然后基于这些有用信息创建适当的标签和属性。
技术之间的彼此赋能可以营造出“1+1>2”的效果,通过知识图谱的加持,可以帮助大模型更好地理解实体关系;反过来,大模型提取出的有用知识又可以反哺知识图谱。
“大模型在垂直场景的应用并不是依靠某一套模型或者某一套算法行走天下,而是需要多模型、跨模态的有机融合,这样的产品设计才更契合细分场景。”张韶峰说道。
而要让多重AI技术融合于场景中,便需要对大模型进行fine-tuning(微调),以此来激发单点小模型的能量。对此,百融云创的做法并非简单地将大模型与小模型进行套用,因为这样会制约底层技术的应变能力,而是依托大模型的基础框架,通过优化、调整特定模型层来适应具体业务场景。
以大模型为基,垂类AI应用料加速
事实上,通过多种AI算法并行、互补的方式来解决垂直领域的实际问题,百融云创已经探索了很多年,并且在多个细分场景有效落地。
以AI赋能银行精细化运营为例,百融云创通过搭建智能运营体系,全面进行客户画像、客群细分,再根据产品特性、服务内容、用户习惯等展开深度挖掘,针对不同的商业场景,实现千人千面的个性化智能服务和精准触达。
张韶峰介绍,百融云创搭建的这一智能运营体系蕴含三类AI算法:第一类是分析、决策与策略类算法,主要用来分析客户特征、预测客户需求;第二类是内容生成算法,即自动、智能地触达客户,与客户交流,向其提供服务;第三类是实时智能交互算法(包括NLP、语音合成算法、“数智人”生成算法),以实时自动生成文字回复、对话等。
在决策式AI与生成式AI的相互增益之下,百融云创云服务类业务稳健扩张,其在细分市场的领先地位进一步稳固,涵盖的金融资产交易规模持续攀升。这其中,既有作为第二增长曲线的生成式AI不断突破助力,以智能语音机器人为例,其可以连续对话不卡顿,且对于客户的语音识别准确率能达到99%以上。同时又源于在决策式AI领域的沉淀积累,据悉,百融云创自建云架构的稳定性高达99.99%,可支撑超过亿次日常查询量,且能提供毫秒级交互反馈。
而随着AI大模型作为新一轮基础设施被广泛应用于垂直领域,其内置的强大AI算法势必会激发更多应用场景和商业模式。张韶峰认为,AI浪潮演绎至今,外界对于大模型的关注将转向其在垂直领域的落地,行业大模型将迸发更多势能,垂类应用和模型能力的结合也会更为紧密。