度小满金融大模型C-Eval、CMMLU双榜排名第一,正式开源!

2023-09-22 18:03:25     来源:

9月22日,度小满宣布“轩辕70B”金融大模型开源,所有用户均可自由下载和试用,并公布了“轩辕70B”在C-Eval、CMMLU两大权威大语言模型评测基准的成绩。数据显示, 在C-Eval榜单上,XuanYuan-70B的总成绩达到71.9分;在CMMLU榜单中,以71.05分的高分位居榜首,在两大权威榜单上的所有开源模型中排名第一,也是国内首个同时在两大权威榜单排名第一的金融大模型。

C-Eval榜单是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,几乎囊括了所有国内外的主流模型,覆盖人文、社科、理工、其他专业四个大方向的52个学科,共有13948个多项选择题和中学、本科、研究生、职业等四个难度级别,是目前对模型潜力判断最具权威性的大模型榜单之一。

CMMLU 数据集是一个综合性的中文评估基准,由MBZUAI、上海交通大学、微软亚洲研究院共同推出,专门用于评估语言模型在中文语境下的知识和推理能力,共涵盖了67个主题,涉及自然科学、社会科学、工程、人文以及常识等。

金融行业场景丰富,数字化程度高,是大模型落地应用的最佳场景之一。但金融又是一个高合规要求的行业,业务决策复杂,大模型真正在金融业务中做到实际应用还面临不少挑战。

度小满CTO许冬亮表示,“相比通用大模型,‘轩辕70B’金融大模型经过度小满业务场景中沉淀的海量金融数据训练,对金融知识理解更专业、更精准,可控性、安全性更高。我们把大模型开源,希望能够降低大模型在金融行业的部署和应用门槛,促进金融行业服务效率和服务体验的突破性革新”。

“轩辕70B”将在社区同时开源金融大模型和50G高质量金融语料,开源下载地址:https://github.com/Duxiaoman-DI/XuanYuan

今年5月份,度小满开源了国内首个千亿参数的金融大模型,已经有上百家金融机构申请试用。本次发布的新版大模型相较于上一个版本能力全面提升:在增量预训练和指令微调阶段,加入了度小满业务场景中的海量金融数据,对金融问题回复更专业,金融知识理解能力提升明显;同时在预训练阶段,"轩辕70B”的模型上下文长度扩充到8k,能够处理更长的金融报告、研究和分析。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

科技创新与延伸——中能国泰董事长沈泰安参访厦门银城智谷
为中国美术教育开辟新思路——李志强(老强)
住友电工为中华人民共和国第二届职业技能大赛提供技术支持和保障
中诚信征信与深圳数交所、数鑫科技联合发布“企业信用数据空间专区”
锅圈食品董事长:速烹菜将成为锅圈到家的第三场景
第五届大运河文化旅游博览会在苏州盛大开幕
自然约定携升级产品再次来袭,为国民头皮保驾护航
成都:“西部链都”的晋级之路
2023年反假货币宣传月--兴业银行泉州分行在行动
世邦魏理仕问鼎2023年上半年中国内地商业地产投资销售活动榜首
四年电池包换,OPPO A2 Pro开售!抗摔设计很亮眼
热烈祝贺德益丰文化数字科技(深圳)有限公司挂牌成功,正式登陆上海股交中心!
热烈祝贺奈尔跨境电商(深圳)有限公司挂牌成功,正式登陆上海股交中心!
热烈祝贺瓯美电缆科技集团股份有限公司挂牌成功,正式登陆上海股交中心!
娱公竞宇不忘初心 持续发力社会公益事业
云天畅想参加2023国际虚拟现实创新大会:算力中心上线
免疫之王菲洛曼脾氨肽,开启人体健康“肽”
“金融消费者权益保护教育宣传月”宣传: 在极端自然灾害中发生事故,保险能赔付吗?
外滩共话ABS | 第九届结构性融资与资产证券化论坛圆满落幕!
CODEMINT纨素之肤携手既下山酒店 溯源野进万亩咖啡田
攀升科技携手霸王茶姬三城联动 深化年轻人市场触达
顶流红光近视防控产品面市,助力构建21世纪视力健康新防线
丝绸之路旅游城市联盟构建国际旅游城市合作发展新图景
瑞尔集团新店再落一子 双品牌推进同城加密战略 加码口腔连锁龙头版图化发展
绿色中国行首次走进湖南 张家界市政府获“2023绿色中国特别贡献奖”
助力兴趣养老 千尺学堂打造在线书法课让中老年群体老有所乐
标准引领提升,迎检促进发展——广东省青少年脊柱侧弯防治标准化试点项目高分通过中期评估
精英律师琚敬:奔赴热爱,巾帼智慧绽芳华
展讯|“光影悦色”老强(李志强)画展9月25日人美美术馆开展
华为全联接大会2023|华为云优品服务,开启云上数智化新体验