写点什么

国内首个!夸克健康大模型通过副主任医师职称考试

  • 2025-05-27
    北京
  • 本文字数:811 字

    阅读完需:约 3 分钟

大小:427.30K时长:02:25
国内首个!夸克健康大模型通过副主任医师职称考试

AI 在医疗领域获重大进展。5 月 27 日,夸克健康大模型在 12 门国家副主任医师职称考试中成绩超过合格线,成为国内首个成功跨越这一门槛的大模型。这意味大模型在严肃医疗场景中迈出了从“知识记忆”向“临床推理”跃迁的关键一步。

 

此前,国内大模型多停留在临床执业医师资格考试阶段,只能拿到初级职称。夸克则实现了从初级到副高级职称的两级跳。夸克健康大模型以通义千问为基础,通过海量的高质量数据构建和多阶段后训练策略实现了此次突破。

 

全新的大模型能力已经可以直接通过夸克搜索调用。用户在使用中会发现,对于严肃医疗问题夸克会通过先分析后搜索,动态检索书籍、指南、药品说明书、医典论文等。这种高搜商的策略显著的提升了复杂病例的准确率。

 

此次副主任医师职称考试评测覆盖了 12 个常用学科,包括:全科医学、普通内科学、普通外科学、妇产科学、小儿内科学、肿瘤内科学、口腔医学、耳鼻咽喉科学、眼科学、皮肤与性病学、精神病学、麻醉学。在上述学科领域,夸克健康大模型均超过合格线,并在全科医学、肿瘤内科学、皮肤与性病学、精神病学 4 个学科达到主任医师及格线。

在初级与中级职称考试中,更小尺寸的夸克健康大模型相比满血版基础模型最高领先 7 分和 10 分左右。进入难度显著提高、强调临床综合运用的副高职称考试时,夸克最高领先幅度扩大至 30 分,在长链推理、诊疗路径规划上有显著提升。这项研究验证了垂直模型在性能提升上具备巨大潜力。

 

对题型维度的深入剖析显示,多选题与病例分析题是所有模型误判率最高的两类。个别通用基础模型在多选题上的正确率均不足 60%,而夸克借助“医疗长思考”机制达到 71%。在病例分析题中,夸克通过检索增强与分步推理组合策略,将正确率提升至 53%。

 

夸克健康算法工程师徐健表示,“机器通过考试并不意味着可以替代医生,但它展示了在辅助诊疗决策、循证检索与患者沟通方面的巨大潜力。我们将不断强化模型能力,帮助医生和患者提升诊疗效率,为用户在居家场景下提供更多健康管理能力”。

2025-05-27 17:234101

评论

发布
暂无评论

我们两周岁啦!InfoQ写作平台正式升级为InfoQ写作社区

InfoQ写作社区官方

热门活动 InfoQ写作社区2周年

远程代码执行漏洞复现分析

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

为什么领导不喜欢提拔老实人?

方云AI研发绩效

团队管理 研发管理 数字化转型 职场 PUA 职场发展

数字人民币试点扩大,市场化问题如何解决?

CECBC

为什么要进行数字化转型

王字 Wannz

数字化生态 数字化转型 finclip 小程序容器

InfoQ专访龙蜥社区陈绪:从CentOS 停服说起,龙蜥操作系统的开源观

OpenAnolis小助手

centos 开源 操作系统 开放原子开源基金会 龙蜥社区

区块链一周热点回顾|虎符元宇宙建筑Hoo HQ已对外开放体验

区块链前沿News

虎符交易所

云效多云视角团队协作方式,让团队协作更高效

阿里云云效

阿里云 项目管理 运维 研发管理 团队协作

为什么要选择Web3?它有什么好处?

CECBC

华为与OpenInfra基金会十年共筑开源基础设施平台

科技热闻

云原生虚拟化的最佳拍档:Kube-OVN + KubeVirt 【附有奖调研】

York

Kubernetes 云原生 网络性能 云原生网络 网络虚拟化

艾瑞咨询:2022年隐私计算卓越者——洞见科技

洞见科技

隐私计算 数据智能解决方案

解读谷歌 Pathways 架构(二):向前一步是 OneFlow

OneFlow

人工智能 机器学习 深度学习 深度学习框架 谷歌

Reactor实现http服务器,附完整代码

Linux服务器开发

后台开发 reactor HTTP Linux服务器开发 服务端开发

【分享汇总】25个主题分享,360°领略OpenHarmony最新技术版图

OpenHarmony开发者

OpenHarmony

机票报价高并发实施的关键路径

Qunar技术沙龙

高并发 后端技术

模块二作业

Dean.Zhang

架构实战营

FAQ是什么?如何高效地创建一个好的FAQ页面?

小炮

FAQ

2022年中国低延时技术市场洞察

易观分析

低延时

linux之chattr命令

入门小站

2022春季校园招聘·复旦站,即将开启~

非凸科技

健康码如何影响世界

王字 Wannz

小程序 微信 finclip 凡泰极客 健康码

有小程序还没有App?试试用小程序转App功能

Speedoooo

APP开发 移动端开发 小程序转app

TDesign 更新周报(2022年4月第2周)

TDesign

Apache ShenYu源码阅读系列-Divide插件

子夜2104

首届物联网数据基础设施案例大赛结果出炉,与 EMQ 和英特尔共同见证物联网的无限可能

EMQ映云科技

物联网 IoT intel emq

等了15年,这本豆瓣评分高达9.3的编程巨著终于出版了!

图灵教育

恒源云(Gpushare)_FAIR CVPR2022新作DVT是个啥?

恒源云

深度学习 CV transform

小波从此逝,江海寄余生,不但是文坛巨擘还是不世出的编程奇才,王小波离世25周年

刘悦的技术博客

编码习惯 编码 代码 编程、 编码规范

免费训练营限时抢报|大咖带你玩转PolarDB for PostgreSQL开源训练营

阿里云数据库开源

数据库 postgresql 开源 阿里云; polarDB

在线SVG在线编辑器

入门小站

工具

国内首个!夸克健康大模型通过副主任医师职称考试_AI&大模型_夸克_InfoQ精选文章