账上仍有30亿元现金,王小川不下牌桌|甲子光年
创始人
2026-01-14 02:27:13

虽然AI医疗这条路确实艰苦,但王小川本人似乎更轻松了。

作者|刘杨楠

编辑|王博

“重整旗鼓,建立连接。”

在1月13日下午的媒体沟通会上,谈及为何要在新模型发布之际和媒体进行一次深入交流时,百川智能创始人、CEO王小川用这八个字回复道。

今天,百川智能正式开源新一代医疗大模型Baichuan-M3,其在全球最权威的医疗AI评测HealthBench中以65.1分的综合成绩位列全球第一;在专门考验复杂决策能力的HealthBench Hard上,也以44.4分的成绩夺冠。

图片来源:百川智能

这一成绩,不仅刷新了 HealthBench的最高分,更首次在医疗领域实现了对GPT-5.2的全面超越。在OpenAI引以为傲的低幻觉领域,M3也实现了超越,幻觉率3.5全球最低。

一众AI创业者中,王小川对生命科学的热情甚高。如今,公司全面转型AI医疗一年多来,从Baichuan-M1到M3,百川几乎保持半年一次的频率迭代模型,并和公立医院、政府均有相应合作落地。这一系列新成果,让王小川再次面向媒体谈起百川时,语气里又多了一分底气。

某种程度上,对王小川而言,转向AI医疗算不上“顺势而为”,而更像是一个被不断压缩选择空间后的必然路径。这也解释了一个关键事实:百川不是在通用模型失败之后才转向医疗,而是在意识到通用模型的边际收益与自身志向并不匹配后,及时收缩战线。

当通用模型进入资本、算力与渠道全面博弈的阶段,创业公司能撬动的空间正在迅速变小。而医疗恰恰相反,它对算力规模的依赖并非第一位,对医学推理、可靠性、长期投入的要求却极高,是一个巨头优势尚未完全展开、但创业公司必须“All in”的赛道。

在王小川看来,近期有两个信号标志着医疗AI正式进入应用落地的阶段。

一是DeepSeek带来的冲击,它让行业看到,除了搜索和代码,AI在专业领域的推理能力正以超越预期的速度进化;二是全球巨头的集体转向,2026年1月初,OpenAI发布ChatGPT Health,Anthropic紧随其后推出Claude的医疗计算与Agent能力。

“2024年跟医生谈AI,大家都不信;2025年大家看到DeepSeek真的比百度靠谱。现在,巨头都进场了,医疗作为AI皇冠上的明珠,已经正式进入应用范畴。”王小川说。

这次沟通会上,王小川透露,公司账面仍有30亿元现金,这给百川智能未来发展提供了极大的确定性。

而关于IPO,王小川表示,大约到2027年,如果市场能够充分接受百川的技术与产品,公司会考虑上市。

可见,AI医疗这场仗,王小川不想、也不会下牌桌。

1.医疗模型要足够“严肃”

在当前各类大模型应用中,快速出产品、拿用户、做收入几乎成为一大共识的打法。

但百川选择了一条更慢、也更重的路径,先把模型做到足够强。即使产品面向C端,模型也要有足够的实力,得到专业医生的认可。

在百川内部,模型能力的领先已经被视为构建公司护城河的第一要素。M3模型的技术路线,集中反映了这一选择背后的逻辑,其背后的训练范式从M2的“半动态强化学习”,升级为M3的“全动态Verifier System”。

在M2阶段,百川构建了一个“虚拟临床世界”。这个世界里有两方:一方是基于真实病例模拟的“虚拟患者”,另一方是负责评估AI表现的“医生思维模型”(考官)。在M2训练中,患者是动态的,但考官是固定的。

“这带来一个问题:当模型越来越强,固定考官出的题就不够难了,能力的增长曲线会变平。”百川智能模型技术负责人鞠强解释道。

于是,M3引入了全动态反馈:当“考生”(AI 模型)变强时,“考官”也会同步进化,从更细粒度、更困难的医学原则出发去挑错。这种对抗性训练,让M3在长对话强化学习中获得了更强的医学推理能力。

此外,为进一步降低幻觉,百川M3将医疗幻觉抑制前移至模型训练阶段,在强化学习过程中将医学事实一致性作为核心训练目标之一,将“知之为知之,不知为不知”直接作用于模型自身能力的形成过程。

这一新的训练方法将医学事实可靠性内化为M3自身的基础能力,使其在不借助任何外部系统的情况下,依然能够基于自身医学知识进行稳定、可信的作答。

通过将事实一致性约束融入训练流程,M3重构了幻觉抑制的训练范式,在不依赖工具或检索增强的纯模型设置下,医疗幻觉率3.5,超越GPT-5.2,达到全球最低水平。

图片来源:百川智能

更具行业分水岭意义的,是百川对“问诊”的重新建模。

在多数AI医疗产品中,问诊被视为一个交互层问题,可以通过prompt或流程设计解决;而百川将其视为一种必须通过强化学习获得的原生能力。

通过SCAN原则——Safety Stratification(安全分层)、Clarity Matters(信息澄清)、Association & Inquiry(关联追问)与Normative Protocol(规范化输出)以及自建评测体系,百川试图把医生高度经验化的思维过程白盒化、结构化。

同时,百川通过在DeepSeek上改进出的SPAR算法,让模型在有限的对话轮次中,能够精准地挖掘关键问题,构建起从临床问询到深度推理,再到安全决策的闭环。

这并非要取代医生的诊疗权(如开刀、检查),而是要在医患之间扮演翻译和顾问。为此,百川的产品“百小应”设计了两种角色模式:

“医生模式”下,百小应会提供极其严肃的循证能力,输出像医学论文一样的标准化描述和引用文献,辅助医生科研和临床决策。

“患者模式”下,百小应将专业医学语言翻译成大白话,不仅解释病情,更会通过满血问诊来收集信息,帮患者分析各种方案的利弊。

这种产品形态在王小川看来是“全球独一无二”的。它不再是一个简单的问答对话框,而是一个能够主动思考、深度挖掘并引导决策的数字医生。

同时,在医疗模型究竟该如何迭代的问题上,与多数医疗模型强调参数规模或多模态能力不同,百川的技术迭代核心围绕三个问题上:

第一,是否具备真正的医学推理能力;

第二,能否在不依赖外部工具的情况下显著降低幻觉;

第三,是否有更强的医疗搜索和循证能力。

不过,王小川透露,百川接下来会发布和图像相关的模型,医疗图像诊断做到SOTA水平。

不得不说,王小川选择的这条路极难,也极慢。但正如王小川所说:“医疗最大的问题,从来不是模型够不够聪明,而是你敢不敢为严肃性付出足够成本。”

账上仍有约30亿元现金,使百川成为少数仍具备长期投入能力的AI医疗创业公司。

2.商业化的主战场在“院外”

如果回看过去二十年的中国医疗科技创业史,会发现一个反复出现的结构性矛盾:技术进步速度很快,但价值兑现极慢。

互联网医疗(如好大夫、春雨医生)本质上在做“连接”,像滴滴和美团一样撮合医生与患者。但医疗行业的根本痛点不在于连接,而在于供给不足。全国最顶尖的医生大多集中在少数一线城市的三甲医院,无论怎么连接,“排队三小时,看病三分钟”的现状都很难短期改变。

王小川认为,AI 应该扮演填补Gap的角色,让基层医疗能力强起来,把医疗阵地从医院延伸到居家。

同时,无论是影像AI、辅助诊断系统,还是互联网医疗平台,大多数项目最终卡在一个问题上——决策方与买单方不统一。

医生拥有诊疗权,却不是付费者;患者是受益者,却缺乏决策权;医保是最大支付方,却对创新极其谨慎。技术越深入临床,阻力反而越大。

在百川的判断中,这正是过去一代互联网医疗以及AI医疗影像项目难以形成规模化商业闭环的根本原因。不是模型不够准,也不是循证不够严,而是路径选择本身出了问题。

因此,百川在战略上做了一个与传统路径明显不同的判断:AI医疗的主战场不在院内,而在院外。

这并不意味着否定医生或医院的价值,而是承认一个现实:在现有制度框架下,院内场景的创新速度天然受限,且高度依赖行政与监管节奏;真正具备增量空间的,是诊前、诊后、慢病管理、康复以及患者长期决策支持等“非共识但高价值”的院外环节。

在这些场景中,AI并不直接替代医生的诊疗权,却可以系统性地补齐医患之间长期存在的信息不对称。

百川反复强调“把决策权还给患者”,并非口号式表达,而是对医疗权力结构的一次重新拆解:诊疗权仍然属于医生;但知情权、理解权与选择权,应逐步回到患者手中。

在王小川看来,只有当患者真正理解自己的病情、方案与风险,医疗AI才可能建立长期信任,而信任,才是商业化之前更高优先级的基础设施。

在具体的落地场景上,百川的选择是:直达患者,主攻儿科、慢病和肿瘤。

儿科是典型的院外高频需求场景;慢病需要长期的居家看护;肿瘤则关乎极高价值的诊后康复和复杂决策。

2026年,百川智能将上线两C端应用,初期采用免费模式,积累用户心智和口碑,建立起信任后再探索商业路径。

但短期内,王小川并不过分担心商业化问题。他认为只要产品能让“小白一次性查清多年前的误诊”,信任带来的口碑效应自然会转化为商业价值。

为此,百川接下来要做的,便是继续打磨技术和产品,并让市场充分接受。王小川预计,这个培育市场的过程大概需要两年(2027年),市场充分成熟后,公司会考虑上市。

同时,王小川透露,长期来看,百川也会考虑出海和布局硬件产品。

但王小川坦言,AI医疗最难的不是技术,而是监管体系与决策结构

医疗不同于自动驾驶,权威性更强,且容错率几乎为0。在法律法规的红线面前,百川只能在有限内做最大价值。他们不轻易开处方,不直接给最终诊断,而是通过极致的循证和信息补全,赋能患者。

“我们之前从通用转医疗被大家骂惨了,这次这场沟通会,也是希望重整旗鼓,重新和大家建立连接。”王小川透露。

此次沟通会上,「甲子光年」感受到,虽然AI医疗这条路确实艰苦,但王小川本人似乎更轻松了,我们相信这种轻松是真诚的,因为它往往源于某种深层的笃定。

王小川谈到,现在每一个新入职的员工他都会亲自面试,确保对方是真的想做医疗,而不是被百川身上各种光环裹挟而来。

在2026年的AI牌桌上,王小川不再试图通过堆砌通用能力来赢得喝彩,而是通过对生命科学的敬畏和对医疗体系的底层重构,找到AI医疗的终极答案。

(封面图来源:电影《赌神》)

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

铂力特融资净买入1.15亿元,... 雷达财经雷助吧出品 文|林宜采 编|深海 东财Choice数据显示,1月12日,铂力特获融资买入4....
一份订单搞定约8年收入?容百科... 锂电产业链又迎来了一个重磅消息。 1月13日晚间,容百科技(688005.SH)公告称,公司与宁德时...
股市必读:豪鹏科技(00128... 截至2026年1月13日收盘,豪鹏科技(001283)报收于69.54元,下跌2.04%,换手率4....
股市必读:*ST万方(0006... 截至2026年1月13日收盘,*ST万方(000638)报收于4.81元,下跌4.94%,换手率4....
原创 曼... 由于格瓦迪奥尔、鲁本-迪亚斯以及斯通斯3名中卫同时伤缺,曼城后防线已经变得捉襟见肘。在冬窗转会市场上...
龙湖全年销售额631.6亿 经... 观点网 2025年多次提到“去库存”的龙湖集团在1月12日晚公布了全年销售数据,整体销售额虽有下滑,...
Hudson River 20... Hudson River 2025年交易收入估计创纪录,达123亿美元。(彭博)
去年全国演出票房收入616.5... 2025年10月7日晚,游客在河北省唐山市丰南区河头老街景区观看演出。 新华社发 本报记者 韩轩 昨...
【得益于关税收入激增,2025... 【得益于关税收入激增,2025年美国财政赤字缩减至1.7万亿美元】2025日历年,美国预算赤字缩减至...
美国12月政府预算 -1447... 美国12月政府预算 -1447亿美元,预期 -1525亿美元,前值 -1733亿美元。