写点什么

国内首个通过主任医师评测的大模型,已在夸克 AI 搜索上线

  • 2025-07-23
    北京
  • 本文字数:938 字

    阅读完需:约 3 分钟

大小:475.08K时长:02:42
国内首个通过主任医师评测的大模型,已在夸克AI搜索上线

7 月 23 日消息,夸克健康大模型成功通过中国 12 门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。目前,“主任级 AI 医生”能力已全面集成至夸克的 AI 搜索中,用户在查询健康问题时,选择深度搜索即可调用。

 

这是继 5 月通过副主任医师职称考试后,夸克健康大模型能力的又一次跃升。在垂类模型与通用模型对比中,夸克健康大模型呈现出难度越高、领先优势越明显的性能曲线,展现出在复杂医学推理任务中的突破。



这揭示了在医学领域研发垂类模型的巨大潜力。夸克健康大模型以通义千问为基础,走出了一条面向垂直场景的深度工程化路线。“我们不是在训练 AI 回答医学问题,而是在训练它学会医学思维”,夸克健康算法负责人徐健说。

 

夸克健康大模型的核心突破之一,是构建出“慢思考能力”。该能力融合了链式推理与多阶段临床演绎路径建模,驱动模型在面对复杂医疗问题时,能够分阶段、层层深入地推导出最终回答。



 构建慢思考能力的前提,是拥有高质量推理训练数据。为此,夸克构建了“双数据产线 + 双奖励机制”的工程体系。一方面,将医学数据划分为“可验证”和“不可验证”两类,分别对应诊断类任务和健康建议类任务;另一方面,在训练方法上引入“过程奖励模型”和“结果奖励模型”,分别评估模型推理链的合理性与最终结论的准确性,显著提升模型的临床可解释性和推理一致性。

 

该体系还设计了多阶段强化学习流程,包括冷启动数据的严格人工校验、多轮样本筛选与难度递进训练策略,以及用于防止“高分投机”的作弊识别机制。通过真实医生标注、“问—思—答”整组数据驱动强化学习,夸克健康大模型不仅学会了医学知识,更掌握了医学思维的路径选择、证据整合与多解平衡能力。底层的权威医学知识库确保了模型输出内容专业、及时。

 

安贞医院心脏外科主任医师谢进生认为,夸克在一些问题上回答专业度比专业医生还要强。这一成果背后是专业医师团队的深度参与。目前,夸克健康大模型拥有千人规模的专业医师标注团队,其中超过 400 名均为副主任医师及以上的高资历医疗专家。

 

凭借在医学领域的专业性,夸克 AI 搜索吸引了一大批医学生和医生群体。夸克健康运营负责人赵存忠介绍,目前平台在全国医学生中月活用户已突破 200 万,覆盖率过半,他们广泛使用夸克用于基础知识搜索、考试备考和临床辅助诊疗。

2025-07-23 17:1710955

评论

发布
暂无评论

思科私有动态路由协议:EIGRP

wljslmz

动态路由 6月月更 路由协议 EIGRP

使用 select 切换协程

宇宙之一粟

golang 6月月更

模块八-设计消息队列存储消息数据的 MySQL 表格

凯博无线

向线程池提交任务

急需上岸的小谢

6月月更

预解析与作用域

Jason199

js 全局作用域 作用域 6月月更

InfoQ 极客传媒 15 周年庆征文|dubbo+zookeeper与提供者provider、消费者consumer通信原理讲解

No Silver Bullet

zookeeper 架构 dubbo 6月月更 InfoQ极客传媒15周年庆

架构训练模块 7

小马

#架构训练营

在M1上体验三星T7移动硬盘的性能

IT蜗壳-Tango

IT蜗壳教学 6月月更

何时使用 Django?与其他开发堆栈的比较

海拥(haiyong.site)

6月月更

消息队列存储消息数据的 MySQL表

Dean.Zhang

动态规划之0-1背包问题(详解+分析+原码)

未见花闻

6月月更

ConcurrentHashMap 源码分析-put方法

zarmnosaj

6月月更

【Python技能树共建】lxml 模块

梦想橡皮擦

Python 6月月更

BaseDexClassLoader那些事

北洋

6月月更

『Three.js』辅助坐标轴

德育处主任

canvas three.js 6月月更

模块8作业

KennyQ

Linux开发_文件目录操作介绍、创建BMP图片

DS小龙哥

6月月更

一文读懂Logstash原理

恒山其若陋兮

6月月更

JavaScript闭包

大熊G

JavaScript 前端 6月月更

SAP HANA 错误消息 SYS_XSA authentication failed SQLSTATE - 28000

汪子熙

数据库 SAP hana 6月月更 数据库权限

C#入门系列(十二) -- 字符串

陈言必行

C# 6月月更

InfoQ 极客传媒 15 周年庆征文|position:fixed 虚拟按键触发后无法生效问题分析及解决方案探究

No Silver Bullet

前端 6月月更 InfoQ极客传媒15周年庆 position:fixed

疫情居家办公体验 | 社区征文

天黑黑

初夏征文

【愚公系列】2022年06月 面向对象设计原则(六)-合成复用原则

愚公搬代码

6月月更

volatile的解构

卢卡多多

volatile 6月月更

直播预告|FeatureStore Meetup V3 重磅来袭!

星策开源社区

机器学习 开源 DevOps 特征平台 MLOps

RF中使用reuqests的两种方式

红毛丹

Python 6月月更

InfoQ 极客传媒 15 周年庆征文|必杀技--使用FFmpeg命令快速精准剪切视频

迷彩

前端 ffmpeg 视频剪辑处理 6月月更 InfoQ极客传媒15周年庆

统一认证中心 Oauth2 高可用坑

Damon

微服务架构 安全架构 6月月更

云原生时代微服务架构设计实践

Damon

6月月更

设计消息队列存储消息数据的 MySQL 表格

小虾米

「架构实战营」

国内首个通过主任医师评测的大模型,已在夸克AI搜索上线_医疗_夸克_InfoQ精选文章