首创证据锚定技术，百川推出最低幻觉循证增强医疗大模型M3 Plus

创始人

2026-01-22 16:39:46

勇砺商业评论阿桶观察白丽

1月22日，百川智能正式发布 Baichuan-M3 Plus，严肃医疗场景下的问答准确性、可靠性，再次刷新了刚刚推出的M3所创下的世界纪录。凭借独创的六源循证技术与M3基座结合，M3 Plus将幻觉率降低至2.6%，低于 Open Evidence，达到全球最低水平；首创“证据锚定”技术，不仅给出引文来源，还能将模型生成的每一句医学结论，精确锚定到原始论文中的对应证据段落，使 AI 的医学判断真正做到可核验、可追责、可教学。

更具意义的是，百川宣布推出「海纳百川」计划，将全球最低幻觉的循证增强医疗大模型以API形式，免费开放给中国医疗服务机构，共同繁荣国内的AI医疗生态，推动中国AI医疗的变革，让每一位中国医务工作者都能拥有可靠、好用的AI助手。

低幻觉率再次刷新世界纪录，让AI具备迈向临床的诊疗能力

对于中国的医生而言，拥抱AI的先决条件，是AI真实具备了足够优秀的诊疗能力。当患者频繁使用DeepSeek、豆包等通用大模型的AI产品去寻求诊疗建议，大量的误判、幻觉，不仅让医生不胜其烦，更逐渐演变为一场对中国医疗AI技术的信任危机。

随着上周百川M3大模型的正式开源，这一局面已被彻底打破。M3不仅在 Healthbench、Healthbench Hard 等多个权威评测中登顶榜首，实现了对 GPT-5.2的全面超越，更在 OpenAI 引以为傲的低幻觉领域完成超越，以3.5%的幻觉率领跑全球。

作为百川拓展低幻觉技术路线的成功实践，M3首创的 Fact-Aware RL的强化学习范式，使底座模型在无工具的设定下，幻觉也能大幅降低到SOTA水平。在此基础上，M3 Plus 将 M2 Plus 模型已验证有效的六源循证范式，引入模型训练和推理过程，确保模型的每条建议都有专业医学证据支持。最终，M3 Plus的事实性幻觉降低到新的SOTA，仅2.6%，相较GPT-5.2大幅下降超30%。即便与行业标杆 Open Evidence相比，M3 Plus 也完成了超越。

首创“证据锚定”技术：让 AI 的每一句医学结论，都能被逐句核验

在循证医学体系中，真正决定医生是否信任一条结论的，从来不是语言是否流畅，而是结论背后的证据是否权威、是否准确、是否可追溯。相比“说得像不像医生”，临床更关心的是：这句话，究竟依据哪篇论文、哪条指南、哪一段原文。

当前行业中，无论是通用大模型还是医疗模型，大多已支持“文献引用”——在结论后标注论文或指南来源。但在实际使用中，医生往往会发现：点开引文，依然无法判断 AI 的这句结论究竟源自哪一段证据。更常见的问题是两类：一是“张冠李戴”，引用编号存在，但文献内容对不上；二是“内容冲突”，文献本身正确，但被引用的段落与结论并不匹配，甚至存在拼接、误读。

百川 M3 Plus 首创“证据锚定（Evidence Anchoring）”技术，不是简单标注“引用自哪篇文献”，而是要求模型生成的每一句医学结论，都必须精确对应到原始论文或指南中的具体证据段落。每一句判断，都能被逐字溯源、逐条核验。

为实现这一目标，百川将“证据锚定”作为独立训练目标，引入 Citation Reward Model，对错误引用进行明确惩罚，让模型只能在“确实有证据支持”的空间中推理与生成。最终，结论与证据段落的匹配准确率超过 95%，真正让 AI 的医学判断做到可核验、可追责、可教学。

M3 Plus API 调用价格较上一代模型大幅降低70%

在大模型快速演进的当下，能力越强的模型，调用成本往往越高，许多优秀的应用因此难以规模化落地，更难真正走进临床一线。百川认为，只有持续降低智力成本，AI 才能覆盖临床、教学等真实场景，成为医生和患者“用得起、用得好”的基础能力。

为此，M3 Plus 在系统层面进行了全面的工程重构，通过 MoE 架构优化、模型量化以及 Gated Eagle-3 投机解码等关键技术，在严格保证模型能力与可靠性的前提下，实现了 API 调用成本较上一代降低 70%，为 AI 在医疗场景的规模化应用扫清了关键障碍。

百川全面开放M3 Plus的技术能力，API限时免费体验15天，所有开发者均可申请使用。

「海纳百川」计划开启，M3 Plus 向行业伙伴免费开放

随着人工智能开始进入门诊、病房和医学教学等真实场景，越来越多医生在工作中接触到 AI：查资料、看指南、对照证据、推敲诊疗方案。但在高强度、强责任的临床环境中，AI 能在多大程度上真正帮到医生，仍需要在真实使用中不断探索。

医生“用好 AI”的新局面，要靠足够多的行业伙伴在真实场景里一起打磨——怎么嵌入医疗流程、怎么做证据呈现、怎么做风险提示、怎么支持年轻医生成长。

为此，百川发起「海纳百川」计划：面向所有服务医务工作者的机构，免费提供全球幻觉最低循证增强医疗大模型 M3 Plus 的 API，把服务医生的AI能力直接交到生态伙伴手里。

从核心技术的持续突破，到面向行业生态的免费开放，「海纳百川」不仅是一个名字，更是一份推动中国AI+医疗发展的承诺。百川愿与行业伙伴一道，围绕医生、面向患者，推动医疗 AI 更安全、更可及、更有温度地发展，让技术进步真正转化为人民健康的长期福祉。

「海纳百川」计划｜参与条件：

适用对象：

为医务工作者提供服务的机构

医务工作者包括医生、药剂师、医技师、护士、健管师、医学生等

适用场景仅限于：

临床辅助决策、医学教育

用途限制：

仅用于真实服务场景、不得用于数据生产

使用要求：

产品需明确展示 Powered by 百川、不得对模型输出进行影响准确性的修改。（白丽）

医学能力技术医疗模型结论循证 Plus 证据医生观点评论百川幻觉

上一篇：富民银行商票业务赋能医疗产业助力“健康中国”战略落地

下一篇：全国在田蔬菜面积7710多万亩，春节期间“菜篮子”供应有保障

⚠️

本网站信息内容及素材来源于网络采集或用户发布，如涉及侵权，请及时联系我们，发送链接至2697952338@QQ.COM，我们将第一时间进行核实与删除处理。

首创证据锚定技术，百川推出最低幻觉循证增强医疗大模型M3 Plus

低幻觉率再次刷新世界纪录，让AI具备迈向临床的诊疗能力

首创“证据锚定”技术：让 AI 的每一句医学结论，都能被逐句核验

M3 Plus API 调用价格较上一代模型大幅降低70%

「海纳百川」计划开启，M3 Plus 向行业伙伴免费开放

相关内容

热门资讯