大咖直播-鸿蒙原生开发与智能提效实战!>>> 了解详情
写点什么

百川智能研究小组负责人阎栋确认出席 QCon 北京站,分享大语言模型在医疗临床的推理实践

  • 2025-03-25
    北京
  • 本文字数:1374 字

    阅读完需:约 5 分钟

大小:734.95K时长:04:10
百川智能研究小组负责人阎栋确认出席QCon北京站,分享大语言模型在医疗临床的推理实践

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


百川智能研究小组负责人阎栋已确认出席并发表题为《Learn to Reason : The way of Baichuan-M1-ClinicReasoning》的主题分享。在代码、数学等需要强大推理能力的领域,大语言模型已经走出实验室走向实践。医疗领域中的临床推理,要求模型基于强大推理能力,将艰深的医学知识灵活应用到对病人病情的分析和检验检查结果的解读上,从而最终获得正确的诊断。本次演讲将从合情推理开始展开介绍,首先回顾强化学习视角下的大语言模型训练的数学基础,然后以 Deepseek R1 为例梳理大语言模型推理技术的发展,再进一步展开介绍百川智能研究小组在训练大语言模型进行临床推理的实践,最后讨论如何继续提升模型能力的可能方向以及大语言模型与人类在智能上的差异表现。


阎栋博士毕业于清华大学计算机系,主要从事决策算法/系统和大语言模型对齐/推理方面的研究,在 ICLR、ICML、IJCAI、AAAI、JMLR、Pattern Recognition 等会议/期刊发表论文数十篇。他带领团队基于 RLHF 增强的大语言模型 Baichuan3,在 2024 年 4 月份的 Superclue 评测中荣获国内第一;开发的深度诊断模型 Baichuan-M1-ClinicReasoning,已上线百小应 APP 和百方医生小程序,并以小于 Deepseek R1 一个数量级的模型大小,在临床推理场景下达到与 R1 相当的性能。他在本次会议的详细演讲内容如下:


演讲提纲

1. 推理:真实世界中的合情推理

2. 序章:强化学习视角下的大语言模型训练

  • 在充满噪声的反馈回路下,带着镣铐学习跳舞

  • 模仿学习、演示学习和偏好学习

3. 脉络:大语言模型的推理技术的发展,以 Deepseek R1 为例

  • 少有人走的路:代码、数学和通用

  • R1-Zero 带来的启示:Test Time Scaling 和 SFT Seed

4. 临床:医疗的内生复杂性,推理能力 + 领域知识的临床推理范式

  • 临床推理范式:生成诊疗假设,继而通过检验检查数据进行假设证伪与排除,最终经由自反思机制对剩余假设进行概率排序,输出符合临床思维路径的诊疗建议

  • 基于 Monte-Carlo Tree Search 进行推理的几个问题:缺乏多样性、树结构退化以及无法利用前序探索路径

  • 临床推理中的 state 和 action 定义,以及基于此进行的 Process Reward Model 数据标注

  • 在没有 R1 的世界大杀四方,Recall “The Bitter Lesson"

5. 展望

  • 重谈场景的摩尔定律(杨植麟 vs 闫俊杰)

  • 大模型是否比我们更靠近终极真理?大模型智能与人类智能的差异表现


您认为,这样的技术在实践过程中有哪些痛点?

  • 专家的稀缺性对 RLHF 范式的根本挑战

  • 通用技术进步的曲线仍然很陡峭的情况下,垂直领域难以构建壁垒


演讲亮点

  • 一站式回顾大语言模型训练的底层数学机理和推理技术发展

  • 对大语言模型与人类在智能方面表现差异的初步讨论


听众收益

  • 深入了解大语言模型的训练和推理技术的发展脉络

  • 获得如何将大语言模型应用到垂直领域的实践经验


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-25 08:003740

评论

发布
暂无评论

iBarcoder for Mac 条形码生成工具

做梦万元户

非凸科技鼎力支持第50届ICPC亚洲区域赛·武汉站,携手共育计算机英才

非凸科技

汽车与机器人产业加速融合,聚焦技术同源共探协同新路径

科技经济

企业海外营销的四阶段模型

Wolink

企业出海 海外社媒营销 海外营销推广 品牌出海 海外红人营销

高光与隐忧:预测市场繁荣下的五大瓶颈

TechubNews

如何通过Python SDK更新Collection中已存在的Doc

DashVector

人工智能 数据库 AI 向量检索 向量

Vibe Coze-企业 AI 应用赛道开启

火山引擎开发者社区

“敏捷产品管理精进课程” 2026年3月14-15日 · A-CSPO认证【提前报名特惠】

ShineScrum

产品 CSPO认证

ForkLift For Mac 双窗口文件管理和FTP管理软件

做梦万元户

安卓iOS原生开发后台Java 即时通讯IM聊天系统功能简介

山东布谷网络科技

IM 即时通讯IM im即时通讯软件开发 IM源码

避开 Playwright 常见坑,让你的 UI 测试跑得又快又稳

测吧(北京)科技有限公司

2025《财富》中国500强峰会在上海圆满落幕

科技经济

“一课双证”Scrum Better with Kanban 认证&Scrum看板实践者认证 |

ShineScrum

Kanban 看板

让AI替你写用例!Dify+RAG工作流,一键生成覆盖率达90%的测试方案

测吧(北京)科技有限公司

【原理到实战】实验异质性分析

京东科技开发者

Aspect Ratio X for Mac 专业比例计算工具

做梦万元户

最新MCP规范解读,看这篇就够了!

京东科技开发者

西格电力智慧能源管理平台——算法如何优化调度?

西格电力

智慧能源 能源管理系统 智慧能源管理系统

企业如何通过海外内容营销打开海外市场

Wolink

企业出海 海外营销推广 海外社媒推广 品牌出海 海外红人营销

DataWorks Agent 正式发布!对话即开发,AI Agent 重新定义数据生产力

阿里云大数据AI技术

阿里云 数据开发 agent Dataworks

Doris 高速查询背后的秘密:如何用 ETL 工具提升数据导入效率

谷云科技RestCloud

数据库 postgresql Doris ETL 数据集成工具

中小企业必看:低预算启动海外推广的7个实战策略

Wolink

跨境电商 海外社媒营销 海外营销推广 海外红人营销 品牌推广

国泰君安基于隐语SecretFlow生产场景探索实践

隐语SecretFlow

sql 数据分析 隐私计算 开源隐私计算框架

第三方物流接口优选:快递鸟物流 API,打破单一快递对接壁垒

快递鸟

成功案例丨平衡性能与安全的仿真:Altair助力 STARD 优化赛车空间车架设计

Altair RapidMiner

人工智能 AI 汽车 仿真 CAE

ATT&CK v18发布:别只更新PPT,更要升级检测逻辑

塞讯科技

ATT&CK

“格物”平台V2.1 | 让全同态密码应用开发更高效

密流智能

隐私保护 数据安全 全同态加密 密文计算 数据可用不可见

Mp3tag for Mac 音频标签编辑器

做梦万元户

多智能体设计模式和智能体框架,你会了么?

京东科技开发者

“团队敏捷教练进阶课程” 2026年1月24-25日 ·在线A-CSM认证

ShineScrum

CSM认证 A-CSM 敏捷认证

"催化型领导力(Catalyst Leadership)"-敏捷领导者CAL1认证 · 2026年3月21-22日(周末班)

ShineScrum

敏捷领导力

百川智能研究小组负责人阎栋确认出席QCon北京站,分享大语言模型在医疗临床的推理实践_AI&大模型_QCon全球软件开发大会_InfoQ精选文章