国内首个！夸克健康大模型通过副主任医师职称考试

AI 在医疗领域获重大进展。5 月 27 日，夸克健康大模型在 12 门国家副主任医师职称考试中成绩超过合格线，成为国内首个成功跨越这一门槛的大模型。这意味大模型在严肃医疗场景中迈出了从“知识记忆”向“临床推理”跃迁的关键一步。

此前，国内大模型多停留在临床执业医师资格考试阶段，只能拿到初级职称。夸克则实现了从初级到副高级职称的两级跳。夸克健康大模型以通义千问为基础，通过海量的高质量数据构建和多阶段后训练策略实现了此次突破。

全新的大模型能力已经可以直接通过夸克搜索调用。用户在使用中会发现，对于严肃医疗问题夸克会通过先分析后搜索，动态检索书籍、指南、药品说明书、医典论文等。这种高搜商的策略显著的提升了复杂病例的准确率。

此次副主任医师职称考试评测覆盖了 12 个常用学科，包括：全科医学、普通内科学、普通外科学、妇产科学、小儿内科学、肿瘤内科学、口腔医学、耳鼻咽喉科学、眼科学、皮肤与性病学、精神病学、麻醉学。在上述学科领域，夸克健康大模型均超过合格线，并在全科医学、肿瘤内科学、皮肤与性病学、精神病学 4 个学科达到主任医师及格线。

在初级与中级职称考试中，更小尺寸的夸克健康大模型相比满血版基础模型最高领先 7 分和 10 分左右。进入难度显著提高、强调临床综合运用的副高职称考试时，夸克最高领先幅度扩大至 30 分，在长链推理、诊疗路径规划上有显著提升。这项研究验证了垂直模型在性能提升上具备巨大潜力。

对题型维度的深入剖析显示，多选题与病例分析题是所有模型误判率最高的两类。个别通用基础模型在多选题上的正确率均不足 60%，而夸克借助“医疗长思考”机制达到 71%。在病例分析题中，夸克通过检索增强与分步推理组合策略，将正确率提升至 53%。

夸克健康算法工程师徐健表示，“机器通过考试并不意味着可以替代医生，但它展示了在辅助诊疗决策、循证检索与患者沟通方面的巨大潜力。我们将不断强化模型能力，帮助医生和患者提升诊疗效率，为用户在居家场景下提供更多健康管理能力”。

创作场景

国内首个！夸克健康大模型通过副主任医师职称考试