浙江组建医学人工智能临床专家库 参与测评医疗大模型
创始人
2025-11-28 14:22:35

中新网杭州11月28日电 (张煜欢)27日记者从浙江省卫生健康委了解到,国家人工智能应用中试基地(医疗)·浙江(下称基地)日前组建成立医学人工智能临床专家库。这支专家团队汇集省内外41家医院和机构的近300名医学专家,覆盖64个专科领域。

他们依托基地与中国医学科学院北京协和医学院、中国信息通信研究院共建的“医学人工智能测评验证联合实验室”,参与医疗大模型能力评测的标准建立、考题制作、结果审核等工作。目前,团队已完成超过20个医疗大模型的评测任务。

图为医生使用大模型参与病历书写。宁大一院供图

近年来,各类医疗大模型纷纷涌现,却缺乏严肃、权威、专业的评价体系。一个核心问题日益凸显:如何确保这些与百姓健康息息相关的AI产品安全、可靠?

“专家团队覆盖了内科、外科、妇产科、儿科等核心临床专科,并纳入了影像、病理等关键医技科室的权威专家,”医疗大模型评测技术负责人康俊晖介绍,“团队已构建超过6万道题的测评题库,建立初审、复审和抽样校验的三审机制。这套严谨的体系,相当于为医学人工智能量身定制了一套‘专业考题’。”

这些考题围绕《卫生健康行业人工智能应用场景参考指引》设计,覆盖患者就医、医生诊疗等真实场景,构建了健康科普、分诊导诊、报告解读、用药指导、检验检查推荐、辅助诊断和辅助病历撰写等七大应用场景。

在题型设计上,团队也进行了创新突破。“常规的客观选择题只能评估模型的知识覆盖能力,难以衡量其在复杂医疗场景中的实际表现。”康俊晖说,“我们大幅增加了主观简答题比重,通过对大模型回答的深度分析,更准确地评估其临床推理能力。”

例如,在辅助诊断场景中,不仅要求模型给出诊断名称,还要求模型详细阐述诊断依据和思路;在用药指导环节,则需要说明药物选择的理由和注意事项。

“医学人工智能是一个非常特殊的领域,伦理、安全、算法黑箱、幻觉等问题倍受关注,稍有不慎,极易导致信任崩塌。”基地相关负责人、浙江省卫生健康信息中心主任李春浦指出,“基于网络公开数据或有限临床数据训练出来的大模型,在一些医院的落地应用中,就出现了‘水土不服’。”

李春浦进一步解释,应用在真实临床诊疗场景下的人工智能产品,仅靠掌握公开的医学教材、文献资料和个别医院的数据是远远不够的。

“这就好比一个医学生,即便熟读教科书,经历了临床实习,仍难以胜任复杂的诊疗工作。因此,我们必须用大量的‘真案例、真标准’来检验,通过不同医院、不同领域真实的临床案例,包括疑难重症病例,参考国内外最新诊疗指南进行评测,才能科学评估人工智能在严肃医疗场景下的真实水平。”李春浦说。

目前,浙江正在开展医疗大模型第二轮的测评验证工作,推动医疗大模型测评将常态化,让真正好用、管用、实用的医疗AI产品加速推广应用,推动医学人工智能高质量发展。(完)

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

如何防止商家恶意冲红发票 数电发票开具简单,冲红也容易。不管财务有没有报销入账,商家均可随意冲红,且无需告知购票方! 但其实...
华夏银行招标结果:华夏银行股份... 证券之星消息,根据天眼查APP-财产线索数据整理,华夏银行股份有限公司1月11日发布《华夏银行股份有...
中科通达中标:武汉东湖新技术开... 证券之星消息,根据天眼查APP-财产线索数据整理,根据武汉东湖新技术开发区科技创新和新经济发展局1月...
苏州发布最新积分落户政策 近日,苏州市人民政府关于延续《市政府关于印发苏州市户籍准入登记管理办法的通知》《市政府关于印发苏州市...
积分营销会员系统 中小商家的增长困局:为何“积分”和“会员”总是推不动? 你店里是不是也有这样的情景? 收银台旁摆着...
京能置业招标结果:【自采】-京... 证券之星消息,根据天眼查APP-财产线索数据整理,京能置业股份有限公司1月11日发布《【自采】-京能...
京能置业招标结果:【自采】-京... 证券之星消息,根据天眼查APP-财产线索数据整理,京能置业股份有限公司1月11日发布《【自采】-京能...
“杀猪宴”爆火后,对话女孩“呆... 近日,因在网上喊人帮忙杀猪,吃刨猪汤,重庆合川女孩“呆呆”闯下“2026年第一场祸”,引发全国网友组...