2025云栖大会,开启通往AGI的未来之旅 了解详情
写点什么

国内首个通过主任医师评测的大模型,已在夸克 AI 搜索上线

  • 2025-07-23
    北京
  • 本文字数:938 字

    阅读完需:约 3 分钟

大小:475.08K时长:02:42
国内首个通过主任医师评测的大模型,已在夸克AI搜索上线

7 月 23 日消息,夸克健康大模型成功通过中国 12 门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。目前,“主任级 AI 医生”能力已全面集成至夸克的 AI 搜索中,用户在查询健康问题时,选择深度搜索即可调用。

 

这是继 5 月通过副主任医师职称考试后,夸克健康大模型能力的又一次跃升。在垂类模型与通用模型对比中,夸克健康大模型呈现出难度越高、领先优势越明显的性能曲线,展现出在复杂医学推理任务中的突破。



这揭示了在医学领域研发垂类模型的巨大潜力。夸克健康大模型以通义千问为基础,走出了一条面向垂直场景的深度工程化路线。“我们不是在训练 AI 回答医学问题,而是在训练它学会医学思维”,夸克健康算法负责人徐健说。

 

夸克健康大模型的核心突破之一,是构建出“慢思考能力”。该能力融合了链式推理与多阶段临床演绎路径建模,驱动模型在面对复杂医疗问题时,能够分阶段、层层深入地推导出最终回答。



 构建慢思考能力的前提,是拥有高质量推理训练数据。为此,夸克构建了“双数据产线 + 双奖励机制”的工程体系。一方面,将医学数据划分为“可验证”和“不可验证”两类,分别对应诊断类任务和健康建议类任务;另一方面,在训练方法上引入“过程奖励模型”和“结果奖励模型”,分别评估模型推理链的合理性与最终结论的准确性,显著提升模型的临床可解释性和推理一致性。

 

该体系还设计了多阶段强化学习流程,包括冷启动数据的严格人工校验、多轮样本筛选与难度递进训练策略,以及用于防止“高分投机”的作弊识别机制。通过真实医生标注、“问—思—答”整组数据驱动强化学习,夸克健康大模型不仅学会了医学知识,更掌握了医学思维的路径选择、证据整合与多解平衡能力。底层的权威医学知识库确保了模型输出内容专业、及时。

 

安贞医院心脏外科主任医师谢进生认为,夸克在一些问题上回答专业度比专业医生还要强。这一成果背后是专业医师团队的深度参与。目前,夸克健康大模型拥有千人规模的专业医师标注团队,其中超过 400 名均为副主任医师及以上的高资历医疗专家。

 

凭借在医学领域的专业性,夸克 AI 搜索吸引了一大批医学生和医生群体。夸克健康运营负责人赵存忠介绍,目前平台在全国医学生中月活用户已突破 200 万,覆盖率过半,他们广泛使用夸克用于基础知识搜索、考试备考和临床辅助诊疗。

2025-07-23 17:178472

评论

发布
暂无评论

手把手带你用 OxyGent 实现智能体的构建、部署与进化

京东零售技术

大白君的奇思妙想:与 AI “辩经”,在质疑中探索 AI 能力的边界

盈米AI开放平台

AI Model-Mutator 人工智能 aiinfra

AWS Builder Center:开发者社区新家园,一站式技术资源与协作平台

qife122

云计算 AWS

Playwright进阶篇 (5) | 网络请求拦截与Mock

测吧(北京)科技有限公司

TapData vs Kafka ETL Pipeline:竞争?共存?——企业实时数据策略的正确打开方式

tapdata

kafka v Kafka vs TapData 实时数据,数据同步

跨境卖家如何与 TikTok 达人合作?这四种方式最有效

Wolink

海外社媒营销 海外营销推广 达人营销

深度解析:腾讯 BiFang 如何借助 Apache Pulsar 引领湖流一体新潮流

AscentStream

小间距LED屏报价,有“标准答案”吗?

Dylan

品牌 LED LED display LED显示屏 LED屏幕

实验室管理系统(源码+文档+讲解+演示)

深圳亥时科技

千亿消息“过眼云烟”?Kafka把硬盘当内存用的性能魔法,全靠这一手!

poemyang

kafka 高并发 消息队列 PageCache

KWDB 分布式架构探究——数据分布与特性

KaiwuDB

数据库 分布式架构 KWDB开源数据库

数智先锋 | 从 “故障难寻” 到 “全链可控”,Bonree ONE 跨越式提升中国铁塔业务监测效能

博睿数据

基于微擎系统的扫码签到 | 会议签到系统:全流程智能会务解决方案

微擎应用市场

国密认证!星环科技Transwarp ArgoDB通过商用密码产品认证

星环科技

用通义灵码渐进式开发 0->1 实现高考志愿规划项目题文档

阿里巴巴云原生

阿里云 云原生 通义灵码

Step by Step 平凯数据库敏捷模式部署

TiDB 社区干货传送门

敏捷模式

报告解读 | 永续引擎持续加速,谁在叩响建筑科技的 “未来之门”

极客天地

还在靠人工死磕转化?天润融通Agent客服助力私域转化效率翻倍

天润融通

从数据到决策:赋能汽车行业的指标体系与AI应用实战方案

袋鼠云数栈

AI 数据 企业数字化转型 指标 汽车行业

智慧健康管理系统:依托微擎生态,开启智慧健康新时代

微擎应用市场

浅谈故障复盘

天翼云开发者社区

安全 安全加速

用通义灵码渐进式开发 0->1 实现高考志愿规划项目题文档

阿里云云效

阿里云 通义灵码

炎酷全域旅游景区导览系统详细介绍

微擎应用市场

绝了!分享一个超赞的UI框架!

王磊

精彩回顾 | 全链路可观测落地能源行业,博睿数据首度公开实战细节!

博睿数据

技术文档 | Pulsar 中的消息保留、过期及积压机制解析(下)

AscentStream

邀请函 I 金秋九月,邀您共赴矩阵起源产品发布会

MatrixOrigin

TEM on 腾讯云 Step by step 丝滑体验

TiDB 社区干货传送门

TEM 试用

大模型工具的 “京东答案”

京东零售技术

从零开始学MCP(6) | MCP 与大型语言模型(LLM)深度集成

测吧(北京)科技有限公司

谷歌重新定位 Gemini AI :超越对话,让 AI贯穿系统且主动;Nexa AI 发布 NPU x 端侧 AI 方案丨日报

声网

国内首个通过主任医师评测的大模型,已在夸克AI搜索上线_医疗_夸克_InfoQ精选文章