写点什么

国内首个!夸克健康大模型通过副主任医师职称考试

  • 2025-05-27
    北京
  • 本文字数:811 字

    阅读完需:约 3 分钟

大小:427.30K时长:02:25
国内首个!夸克健康大模型通过副主任医师职称考试

AI 在医疗领域获重大进展。5 月 27 日,夸克健康大模型在 12 门国家副主任医师职称考试中成绩超过合格线,成为国内首个成功跨越这一门槛的大模型。这意味大模型在严肃医疗场景中迈出了从“知识记忆”向“临床推理”跃迁的关键一步。

 

此前,国内大模型多停留在临床执业医师资格考试阶段,只能拿到初级职称。夸克则实现了从初级到副高级职称的两级跳。夸克健康大模型以通义千问为基础,通过海量的高质量数据构建和多阶段后训练策略实现了此次突破。

 

全新的大模型能力已经可以直接通过夸克搜索调用。用户在使用中会发现,对于严肃医疗问题夸克会通过先分析后搜索,动态检索书籍、指南、药品说明书、医典论文等。这种高搜商的策略显著的提升了复杂病例的准确率。

 

此次副主任医师职称考试评测覆盖了 12 个常用学科,包括:全科医学、普通内科学、普通外科学、妇产科学、小儿内科学、肿瘤内科学、口腔医学、耳鼻咽喉科学、眼科学、皮肤与性病学、精神病学、麻醉学。在上述学科领域,夸克健康大模型均超过合格线,并在全科医学、肿瘤内科学、皮肤与性病学、精神病学 4 个学科达到主任医师及格线。

在初级与中级职称考试中,更小尺寸的夸克健康大模型相比满血版基础模型最高领先 7 分和 10 分左右。进入难度显著提高、强调临床综合运用的副高职称考试时,夸克最高领先幅度扩大至 30 分,在长链推理、诊疗路径规划上有显著提升。这项研究验证了垂直模型在性能提升上具备巨大潜力。

 

对题型维度的深入剖析显示,多选题与病例分析题是所有模型误判率最高的两类。个别通用基础模型在多选题上的正确率均不足 60%,而夸克借助“医疗长思考”机制达到 71%。在病例分析题中,夸克通过检索增强与分步推理组合策略,将正确率提升至 53%。

 

夸克健康算法工程师徐健表示,“机器通过考试并不意味着可以替代医生,但它展示了在辅助诊疗决策、循证检索与患者沟通方面的巨大潜力。我们将不断强化模型能力,帮助医生和患者提升诊疗效率,为用户在居家场景下提供更多健康管理能力”。

2025-05-27 17:234

评论

发布
暂无评论

免费试听 | AI自动化副业创收班手把手带你提升副业收益

测试人

软件测试

神策SDK不支持Windows客户端全埋点,怎么实现用户统计分析?

ClkLog

C++客户端 C#客户端 C++客户端用户分析 C#客户端用户分析 windows客户端用户分析

mac电脑可以玩的Red Alert红色警戒:红警2 for Mac合集

你的猪会飞吗

红色警戒 Mac游戏下载 红警游戏下载

海大集团的可观测平台建设实践

巴辉特

监控 可观测性 Prometheus Nightingale Flashcat

TiDB 究竟抖还是不抖?

TiDB 社区干货传送门

版本升级

从 Oracle 到 TiDB 丨数据库资源评估指南

TiDB 社区干货传送门

迁移

类似咸鱼/转转闲置二手商品交易回收商城系统源码定制开发搭建

网站,小程序,APP开发定制

YETUADMIN 野兔二手交易系统 ThinkPHP8

【论文速读】|RO-SVD:一种用于 AIGC 应用的可重构硬件版权保护框架

云起无垠

【行业知识】餐饮业怎么定义?需要堡垒机吗?

行云管家

等保 堡垒机 餐饮

小城酒店也要数智化,火山引擎数据飞轮能带去哪些想象?

字节跳动数据平台

大数据 数字化转型 云服务 数据平台 数据飞轮

【论文速读】| ARVO: 开源软件可重现漏洞的全景图

云起无垠

挖掘大模型行业落地潜力,火山引擎发布AI创作者大赛

极客天地

好多kafka难题啊,看看其中的化解之道

王中阳Go

Go kafka 面试 面经

智能未来:低代码与AI如何重塑企业应用开发

天津汇柏科技有限公司

低代码 企业级应用程序开发 AI 人工智能

保定等保测评机构有吗?在哪里?

行云管家

网络安全 等保 堡垒机 保定

工作 6 年,@Transactional 注解用的一塌糊涂

程序员小富

Java 事务回滚

工作太忙没时间学习,怎么办?

老张

职场成长 认知 学习成长

在数小时内构建 CRM:你需要了解的顶级无代码/低代码工具

NocoBase

低代码 CRM 无代码

TiDB DR-Auto-Sync 同城双中心高可用实践丨银行核心背后的落地工程体系

TiDB 社区干货传送门

RPA项目:RPA工作原理及其应用领域

八爪鱼采集器︱RPA机器人

RPA 自动化 RPAxAI

智能BI新突破,看思迈特新品背后的第二增长曲线!

ToB行业头条

第65期 | GPTSecurity周报

云起无垠

在线文库网站程序系统源码/app/小程序开发定制

网站,小程序,APP开发定制

是什么拖慢了医疗云桌面的部署进程?

上海锐起科技

技术分享丨使用 Knowledge Bases for Amazon Bedrock 制作 RAG 工具

伊克罗德信息科技

大数据 AWS Amazon Bedrock

国内首个!夸克健康大模型通过副主任医师职称考试_AI&大模型_夸克_InfoQ精选文章