写点什么

国内首个!夸克健康大模型通过副主任医师职称考试

  • 2025-05-27
    北京
  • 本文字数:811 字

    阅读完需:约 3 分钟

大小:427.30K时长:02:25
国内首个!夸克健康大模型通过副主任医师职称考试

AI 在医疗领域获重大进展。5 月 27 日,夸克健康大模型在 12 门国家副主任医师职称考试中成绩超过合格线,成为国内首个成功跨越这一门槛的大模型。这意味大模型在严肃医疗场景中迈出了从“知识记忆”向“临床推理”跃迁的关键一步。

 

此前,国内大模型多停留在临床执业医师资格考试阶段,只能拿到初级职称。夸克则实现了从初级到副高级职称的两级跳。夸克健康大模型以通义千问为基础,通过海量的高质量数据构建和多阶段后训练策略实现了此次突破。

 

全新的大模型能力已经可以直接通过夸克搜索调用。用户在使用中会发现,对于严肃医疗问题夸克会通过先分析后搜索,动态检索书籍、指南、药品说明书、医典论文等。这种高搜商的策略显著的提升了复杂病例的准确率。

 

此次副主任医师职称考试评测覆盖了 12 个常用学科,包括:全科医学、普通内科学、普通外科学、妇产科学、小儿内科学、肿瘤内科学、口腔医学、耳鼻咽喉科学、眼科学、皮肤与性病学、精神病学、麻醉学。在上述学科领域,夸克健康大模型均超过合格线,并在全科医学、肿瘤内科学、皮肤与性病学、精神病学 4 个学科达到主任医师及格线。

在初级与中级职称考试中,更小尺寸的夸克健康大模型相比满血版基础模型最高领先 7 分和 10 分左右。进入难度显著提高、强调临床综合运用的副高职称考试时,夸克最高领先幅度扩大至 30 分,在长链推理、诊疗路径规划上有显著提升。这项研究验证了垂直模型在性能提升上具备巨大潜力。

 

对题型维度的深入剖析显示,多选题与病例分析题是所有模型误判率最高的两类。个别通用基础模型在多选题上的正确率均不足 60%,而夸克借助“医疗长思考”机制达到 71%。在病例分析题中,夸克通过检索增强与分步推理组合策略,将正确率提升至 53%。

 

夸克健康算法工程师徐健表示,“机器通过考试并不意味着可以替代医生,但它展示了在辅助诊疗决策、循证检索与患者沟通方面的巨大潜力。我们将不断强化模型能力,帮助医生和患者提升诊疗效率,为用户在居家场景下提供更多健康管理能力”。

2025-05-27 17:234147

评论

发布
暂无评论

视觉与图像识别自动化测试 | 文字转语音

测试人

人工智能

区块链NFT系统的类型及特点

北京木奇移动技术有限公司

区块链技术 软件外包公司 NFT系统

【Mac/win】Axure RP 8授权密钥+Axure RP 8离线激活教程

Rose

中烟创新智能稽核平台:为烟草行业定制的数字化风控引擎

中烟创新

BOE(京东方)“照亮成长路”公益项目新十年启幕 科技无界照亮美好未来

科技热闻

如何判断两张图片的相似度?原来图片对比也可以如此简单!

左诗右码

大促数据库压力激增,如何一眼定位 SQL 执行来源?

京东科技开发者

内网IM选型逻辑:企业为何青睐自研或外采私有化IM

BeeWorks

即时通讯 IM

BaikalDB 架构演进实录:打造融合向量化与 MPP 的 HTAP 查询引擎

百度Geek说

MPP 分布式数据 MPP 架构 向量化引擎

焱融存储成为 AMD 中国行业生态共建计划首批合作伙伴

焱融科技

人工智能 AMD AMD EPYC 处理器 焱融全闪存储

由 Mybatis 源码畅谈软件设计(九):“能用就行” 其实远远不够

京东科技开发者

Moho pro 13下载安装教程 附Moho pro 13中文激活补丁-Mac/win

Rose

员工反感的不是周报,而是消耗人的形式化

禅道项目管理

项目管理 数字化转型 周报 禅道项目管理软件

三维高级渲染工具Artlantis 2021一键激活版-mac/win

Rose

区块链NFT系统的上线流程

北京木奇移动技术有限公司

区块链技术 软件外包公司 音乐NFT

DJ舞台设计:重塑电子音乐体验

Dylan

Dj LED显示屏 全彩LED显示屏 led显示屏厂家 舞台表演

就医体验飙升的背后,是CPU在“悄悄打工”?

E科讯

深入研究:shopee商品列表API接口指南

tbapi

shopee商品列表接口 shopee数据采集 shopee接口

分析师:对英特尔未来发展持谨慎乐观态度

E科讯

开发十年现状之后端的职业发展

秃头小帅oi

Archicad 28最新的改进,使用设计更加舒适和高效

Rose

2026深圳电子展,中国(深圳)国际电子信息展览会

AIOTE智博会

电子展 深圳电子展 电子信息展 电博会

家政到家服务平台(源码+文档+讲解+演示)

深圳亥时科技

哪里有Principle 汉化版?Principle mac中文资源分享

Rose

数字藏品(NFT)系统的上线运营

北京木奇移动技术有限公司

区块链技术 软件外包公司 音乐NFT

VMware Fusion 专业版 v13.6.3 中文版 附激活码

Rose

小程序容器驱动SuperApp生态:下一代前端技术范式

xuyinyin

准确率从 19% 提升至 95%!文本审核模型优化的三个阶段实践(下)

亚马逊云科技 (Amazon Web Services)

通义灵码 AI IDE 上线!智能体+MCP 从手动调用工具过渡到“AI 主动调度资源”

阿里巴巴云原生

通义灵码

通义灵码 AI IDE 上线!智能体+MCP 从手动调用工具过渡到“AI 主动调度资源”

阿里云云效

ide 通义灵码

前端开发中依赖包有问题怎么办

京东科技开发者

国内首个!夸克健康大模型通过副主任医师职称考试_AI&大模型_夸克_InfoQ精选文章