写点什么

国内首个通过主任医师评测的大模型,已在夸克 AI 搜索上线

  • 2025-07-23
    北京
  • 本文字数:938 字

    阅读完需:约 3 分钟

大小:475.08K时长:02:42
国内首个通过主任医师评测的大模型,已在夸克AI搜索上线

7 月 23 日消息,夸克健康大模型成功通过中国 12 门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。目前,“主任级 AI 医生”能力已全面集成至夸克的 AI 搜索中,用户在查询健康问题时,选择深度搜索即可调用。

 

这是继 5 月通过副主任医师职称考试后,夸克健康大模型能力的又一次跃升。在垂类模型与通用模型对比中,夸克健康大模型呈现出难度越高、领先优势越明显的性能曲线,展现出在复杂医学推理任务中的突破。



这揭示了在医学领域研发垂类模型的巨大潜力。夸克健康大模型以通义千问为基础,走出了一条面向垂直场景的深度工程化路线。“我们不是在训练 AI 回答医学问题,而是在训练它学会医学思维”,夸克健康算法负责人徐健说。

 

夸克健康大模型的核心突破之一,是构建出“慢思考能力”。该能力融合了链式推理与多阶段临床演绎路径建模,驱动模型在面对复杂医疗问题时,能够分阶段、层层深入地推导出最终回答。



 构建慢思考能力的前提,是拥有高质量推理训练数据。为此,夸克构建了“双数据产线 + 双奖励机制”的工程体系。一方面,将医学数据划分为“可验证”和“不可验证”两类,分别对应诊断类任务和健康建议类任务;另一方面,在训练方法上引入“过程奖励模型”和“结果奖励模型”,分别评估模型推理链的合理性与最终结论的准确性,显著提升模型的临床可解释性和推理一致性。

 

该体系还设计了多阶段强化学习流程,包括冷启动数据的严格人工校验、多轮样本筛选与难度递进训练策略,以及用于防止“高分投机”的作弊识别机制。通过真实医生标注、“问—思—答”整组数据驱动强化学习,夸克健康大模型不仅学会了医学知识,更掌握了医学思维的路径选择、证据整合与多解平衡能力。底层的权威医学知识库确保了模型输出内容专业、及时。

 

安贞医院心脏外科主任医师谢进生认为,夸克在一些问题上回答专业度比专业医生还要强。这一成果背后是专业医师团队的深度参与。目前,夸克健康大模型拥有千人规模的专业医师标注团队,其中超过 400 名均为副主任医师及以上的高资历医疗专家。

 

凭借在医学领域的专业性,夸克 AI 搜索吸引了一大批医学生和医生群体。夸克健康运营负责人赵存忠介绍,目前平台在全国医学生中月活用户已突破 200 万,覆盖率过半,他们广泛使用夸克用于基础知识搜索、考试备考和临床辅助诊疗。

2025-07-23 17:177124

评论

发布
暂无评论

浅谈SpringCloud之服务注册中心Eureka

北漂码农有话说

Redis 6.0 新特性-多线程连环13问!

牧码哥

redis 多线程 io

从删库到跑路?

芦苇

产品 职业 产品经理 职业素养 职业道德

聊聊苹果账号的那些事儿

不要艾特我

iphone

css常见问题总结

靖仙

CSS css3

关于GDB你需要知道的技巧

泰伦卢

c c++ C#

内存对齐

泰伦卢

c c++ C#

当我们谈到ThreadLocal的时候,我们在谈什么?

Jason

Java 多线程 ThreadLocal

MySQL中 int(11)和 int(10) 到底有没有区别?

周三不加班

MySQL 字符宽度 数据库数据类型

从一道面试题来看计算机基础知识的重要性

周三不加班

数组 堆栈 函数栈 函数栈调用

Python3.6.1官方文档练习——初入江湖(一)

小匚

Python python3.x 入门

DDD 实践手册(4. Aggregate — 聚合)

Joshua

设计模式 领域驱动设计 架构模式

C++定时器的实现

泰伦卢

c c++ C#

笔记:《如何系统思考》之如何做到系统思考

wiflish

思维方式

面试指南 | 终于要跟大家见面了,我有点紧张。

Apache Flink

大数据 flink 流计算 实时计算

Clickhouse 性能测试

久吾尔岂

翻译和产品本地化的区别是什么?

葛仲君

翻译 本地化 全球化 产品开发

金融「中台」十宗罪

FinClip

中台 企业中台 业务中台

机会是留给不停寻找他们的人,而不是原地等待的人

非著名程序员

程序员 提升认知 机会 行动派

业务代码的救星——Java 对象转换框架 MapStruct 妙用

周三不加班

MapStruct 对象转换

《TCP/IP详解》概述

网瘾少年SEC

TCP 网络协议 IP

写字工具更新史

Bonaparte

学习 读书笔记

开源商业模式促进金融业科技生态的发展

FinClip

开源 金融科技

写作的意义到底是什么

董一凡

写作

centos7 maven私服自动启动

kcnf

各大公司面试题分类整理

是小毛吖

面试 后端

一个平凡程序员的年度总结

小智

程序员 人生

【译】【UX】一个页面可以有多个面包屑导航吗?

Yukun

用户研究 UX 面包屑导航

一次线上服务高 CPU 占用优化实践

挖坑的张师傅

性能优化 JVM cpu

开始每周写作计划

M1racle

C++线程池的实现

泰伦卢

c++ C# 线程池

国内首个通过主任医师评测的大模型,已在夸克AI搜索上线_医疗_夸克_InfoQ精选文章