智明堂大模型获国家中医执业医师测试最佳成绩，首创TCM-Eval基准促行业标准化

2025年12月20日，北京智明堂科技有限公司联合北京航空航天大学、原广州中医药大学博士生导师佘世锋教授团队、北京知言吉智科技有限公司正式发布自主研发的“智明堂”中医大语言模型ZMT-M1。该大模型在近期国家中医执业医师资格考试模拟测试中，以96.26的高分斩获迄今该领域最佳成绩，远超其它已公开宣布的大模型。

同时，团队正式推出全球首个动态可扩展的中医大模型评测基准 TCM-Eval 及测试平台（https://tcmeval.bamaidical.com），为中医大模型提供了公开、透明的竞技平台。自平台测试上线以来，已收到十余家机构及企业的试用申请，这标志着中医大模型首次拥有了标准化与可落地的临床级大模型，产业智能化升级将进入快车道。

图：已参与测试大模型的主实验结果，智明堂ZMT大模型以96.26的高分斩获迄今该领域最佳成绩

长期以来，中医大模型缺乏公开、可复现的评估标准，研发者往往“自说自话”难以横向对比。TCM-Eval填补了行业缺乏统一、科学评估标准的空白，为中医药智能化发展奠定了标准化基石。

TCM-Eval设置中医执业医师考试、中医医师职称考试、中医研究生入学考试、中医理论专题问答、中医临床实践等5大模块，共18个数据集。其中考试类数据集由权威中医专家团队根据国家医考大纲命题，中医理论问答数据集由权威中医专家团队根据中医专业教科书等通过国家认证的教材构建，中医临床实践数据集来源于真实病例并经过匿名化处理。

目前该平台精选、编纂了6,099道高质量试题，涵盖“理论认知、临床辨证、方剂应用、针灸实操”四大维度，并由多位权威中医专家交叉审定，支持全球机构参加评测与排名。

在同一批模拟测试中，智明堂ZMT-M1大模型综合得分刷新行业纪录，其“中医内科学”、“中医外科学”正确率超 92%，“辨证论治”、“方剂配伍”、“针灸选穴”与资深中医师决策一致性达88%，不仅领先行业平均水平，也远超其它已公开宣布的大模型。

论文链接：https://arxiv.org/abs/2511.07148

据智明堂团队公开发表的论文显示，其大模型的卓越性能，源于团队首创的SI-CoTE（Self-Iterative Chain-of-Thought Enhancement）训练框架：以DeepSeek-R1 671B为基座，通过“模型自举+人在环路”多轮迭代，累计构建384,807条高质量思维链样本，难例正确率提升42%，在有限的计算资源下（单节点8张H20 141G）将训练周期压缩至45天，成本降低35%，实现数据质量与模型能力同步进化。

在数据侧，团队严格限定数据源为国家中医执业资格考试指定的18本权威教材，经OCR+人工双重清洗获得99.8%纯净文本，拆分为1.2万个知识块，结合6万道公开模拟题去重与可信度过滤，最终建成384,807条指令问答、约1.59亿中文词元，临床类样本占比超60%，确保模型“懂理论，更懂实战”。

2025年7月，智明堂ZMT-M1模型已在银川、西安8家中医门诊中试点应用，9月扩展至全国100余间诊室。AI完成病历整理、处方建议、经典方剂推荐、方解自动生成等功能，单店接诊效率提升了115%，用户处方支付率提升34%，复诊率提升25.8%，实现年轻医生经验补足、资深医生效率倍增的双赢，首次证实了中医大模型具备临床辅助级能力。

据了解，智明堂CEO王刚毕业于哈尔滨工业大学自然语言理解专业，CTO付瑞吉与王刚师出同门，为哈工大本硕博、中科大博士后，曾任科大讯飞AI研究院副院长、快手AI技术总监，曾获吴文俊人工智能科技进步奖一等奖，在顶级国际会议和期刊上发表学术论文30余篇，申请（获得）国家发明专利60项。

同时，CTO付瑞吉在人工智能领域拥有丰富的实战经验：曾主持研发业界首个亿级别多模态短视频百科知识图谱“快知”和快手大模型Agent技术KwaiAgents；负责研发的智能评阅技术在多地中高考、CET等大规模考试阅卷中广泛应用；负责研发的个性化学习技术应用于讯飞学习机等多款教育产品中等。

随着现代AI技术的快速发展，AI+中医辅助诊断的发展空间巨大。据智明堂负责人介绍，公司下一步将推进大模型的智能化硬件落地，不断更新和完善中医大模型及评测体系，面向体检机构、医疗机构、科研院所、终端渠道开放，携手合作伙伴完善中医智能化基础设施，共同推动中医药的现代化、标准化、国际化发展。

免责声明：市场有风险，选择需谨慎！此文仅供参考，不作买卖依据。

智明堂大模型获国家中医执业医师测试最佳成绩，首创TCM-Eval基准促行业标准化

相关阅读

猜你喜欢

热点图片

要闻