写点什么

国内首个通过主任医师评测的大模型,已在夸克 AI 搜索上线

  • 2025-07-23
    北京
  • 本文字数:938 字

    阅读完需:约 3 分钟

大小:475.08K时长:02:42
国内首个通过主任医师评测的大模型,已在夸克AI搜索上线

7 月 23 日消息,夸克健康大模型成功通过中国 12 门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。目前,“主任级 AI 医生”能力已全面集成至夸克的 AI 搜索中,用户在查询健康问题时,选择深度搜索即可调用。

 

这是继 5 月通过副主任医师职称考试后,夸克健康大模型能力的又一次跃升。在垂类模型与通用模型对比中,夸克健康大模型呈现出难度越高、领先优势越明显的性能曲线,展现出在复杂医学推理任务中的突破。



这揭示了在医学领域研发垂类模型的巨大潜力。夸克健康大模型以通义千问为基础,走出了一条面向垂直场景的深度工程化路线。“我们不是在训练 AI 回答医学问题,而是在训练它学会医学思维”,夸克健康算法负责人徐健说。

 

夸克健康大模型的核心突破之一,是构建出“慢思考能力”。该能力融合了链式推理与多阶段临床演绎路径建模,驱动模型在面对复杂医疗问题时,能够分阶段、层层深入地推导出最终回答。



 构建慢思考能力的前提,是拥有高质量推理训练数据。为此,夸克构建了“双数据产线 + 双奖励机制”的工程体系。一方面,将医学数据划分为“可验证”和“不可验证”两类,分别对应诊断类任务和健康建议类任务;另一方面,在训练方法上引入“过程奖励模型”和“结果奖励模型”,分别评估模型推理链的合理性与最终结论的准确性,显著提升模型的临床可解释性和推理一致性。

 

该体系还设计了多阶段强化学习流程,包括冷启动数据的严格人工校验、多轮样本筛选与难度递进训练策略,以及用于防止“高分投机”的作弊识别机制。通过真实医生标注、“问—思—答”整组数据驱动强化学习,夸克健康大模型不仅学会了医学知识,更掌握了医学思维的路径选择、证据整合与多解平衡能力。底层的权威医学知识库确保了模型输出内容专业、及时。

 

安贞医院心脏外科主任医师谢进生认为,夸克在一些问题上回答专业度比专业医生还要强。这一成果背后是专业医师团队的深度参与。目前,夸克健康大模型拥有千人规模的专业医师标注团队,其中超过 400 名均为副主任医师及以上的高资历医疗专家。

 

凭借在医学领域的专业性,夸克 AI 搜索吸引了一大批医学生和医生群体。夸克健康运营负责人赵存忠介绍,目前平台在全国医学生中月活用户已突破 200 万,覆盖率过半,他们广泛使用夸克用于基础知识搜索、考试备考和临床辅助诊疗。

2025-07-23 17:177973

评论

发布
暂无评论

2022全网最详细的音视频开发学习路线,零基础到项目实战,从小白到音视频专家

Linux服务器开发

音视频 WebRTC ffmpeg 音视频开发 流媒体服务器开发

人脸识别闸机惊艳美国运动员背后的黑科技是如何实现的?

天翼云开发者社区

东方电机打造大国重器 携手天翼云挺起智能制造新脊梁 智能制造的力量 东方电机的数字化前行之路

天翼云开发者社区

ENS 域名终极指南

devpoint

以太坊 eth 3月月更 ens

Redis现网那些坑:用个缓存,还要为磁盘故障买单?

华为云数据库小助手

redis GaussDB GaussDB ( for Redis ) 华为云数据库

高精度轻量级目标检测产业应用,实现多类通信塔识别

百度大脑

详细解读阿里云开源PolarDB总体架构和企业级特性

阿里云数据库开源

数据库 阿里云 polarDB

一周信创舆情观察(2.28~3.6)

统小信uos

通过CRM系统提高生产力的技巧

低代码小观

企业管理 CRM 企业管理系统 CRM系统 客户关系管理系统

2022年3月中国数据库排行榜:TiDB “三连降”仍霸榜首,“常胜四将军”得分集体下跌

墨天轮

数据库 TiDB 国产数据库 KingBase gbase8a

极速体验|使用 Erda 微服务观测接入 Jaeger Trace

尔达Erda

云计算 微服务 云原生 PaaS 分布式架构

不为人知的网络编程(十四):拔掉网线再插上,TCP连接还在吗?一文即懂!

JackJiang

网络编程 TCP/IP TCP协议 即时通讯IM

翻译 | 解读首部 Kubernetes 纪录片

RadonDB

开源 Kubernetes RadonDB

恒源云(GpuShare)_PRGC:基于潜在关系和全局对应的联合关系三元组抽取

恒源云

机器学习 深度学习 算法 知识图谱

[架构实战营] 模块9设计

Vincent

「架构实战营」

Flutter ChartSpace:通过跨端 Canvas 实现图表库

字节跳动终端技术

flutter 字节跳动 前端 canvas 图表库

Linux之netstat命令

入门小站

Linux

星际营23期开始招募 门槛高,但是优秀项目可获得全额奖学金,敢来挑战吗?

创业邦

在线YAML转TOML工具

入门小站

工具

天翼云发布云原生关系型数据库TeleDB for openGauss

天翼云开发者社区

HAVE FUN | SOFARegistry 源码解析

SOFAStack

GitHub 开源 程序员 开发者 源码剖析

上讯信息正式加入openGauss社区

华为云大数据轻模式体验:忘掉底层烦恼,专注数据开发

华为云开发者联盟

大数据 Serverless 数据湖 数据开发 华为云

经验分享 | 如何搭建FAQ/用户培训手册

小炮

运营 客户服务

在充满挑战的时代天翼云以数字化加速市域社会治理现代化

天翼云开发者社区

如何打造极速数据湖分析引擎

StarRocks

数据库 数据分析 StarRocks

《中国软件根技术发展白皮书(基础软件册)》发布!

opengauss

上海英方软件正式加入openGauss社区

opengauss

openGauss助力中国移动获 “ICT优秀案例”

opengauss

Linux curl命令详解

学神来啦

云计算 Linux 运维 curl

以数字化为引领天翼云助力中安公司应急管理云平台上线

天翼云开发者社区

国内首个通过主任医师评测的大模型,已在夸克AI搜索上线_医疗_夸克_InfoQ精选文章