写点什么

百川智能研究小组负责人阎栋确认出席 QCon 北京站,分享大语言模型在医疗临床的推理实践

  • 2025-03-25
    北京
  • 本文字数:1374 字

    阅读完需:约 5 分钟

大小:734.95K时长:04:10
百川智能研究小组负责人阎栋确认出席QCon北京站,分享大语言模型在医疗临床的推理实践

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


百川智能研究小组负责人阎栋已确认出席并发表题为《Learn to Reason : The way of Baichuan-M1-ClinicReasoning》的主题分享。在代码、数学等需要强大推理能力的领域,大语言模型已经走出实验室走向实践。医疗领域中的临床推理,要求模型基于强大推理能力,将艰深的医学知识灵活应用到对病人病情的分析和检验检查结果的解读上,从而最终获得正确的诊断。本次演讲将从合情推理开始展开介绍,首先回顾强化学习视角下的大语言模型训练的数学基础,然后以 Deepseek R1 为例梳理大语言模型推理技术的发展,再进一步展开介绍百川智能研究小组在训练大语言模型进行临床推理的实践,最后讨论如何继续提升模型能力的可能方向以及大语言模型与人类在智能上的差异表现。


阎栋博士毕业于清华大学计算机系,主要从事决策算法/系统和大语言模型对齐/推理方面的研究,在 ICLR、ICML、IJCAI、AAAI、JMLR、Pattern Recognition 等会议/期刊发表论文数十篇。他带领团队基于 RLHF 增强的大语言模型 Baichuan3,在 2024 年 4 月份的 Superclue 评测中荣获国内第一;开发的深度诊断模型 Baichuan-M1-ClinicReasoning,已上线百小应 APP 和百方医生小程序,并以小于 Deepseek R1 一个数量级的模型大小,在临床推理场景下达到与 R1 相当的性能。他在本次会议的详细演讲内容如下:


演讲提纲

1. 推理:真实世界中的合情推理

2. 序章:强化学习视角下的大语言模型训练

  • 在充满噪声的反馈回路下,带着镣铐学习跳舞

  • 模仿学习、演示学习和偏好学习

3. 脉络:大语言模型的推理技术的发展,以 Deepseek R1 为例

  • 少有人走的路:代码、数学和通用

  • R1-Zero 带来的启示:Test Time Scaling 和 SFT Seed

4. 临床:医疗的内生复杂性,推理能力 + 领域知识的临床推理范式

  • 临床推理范式:生成诊疗假设,继而通过检验检查数据进行假设证伪与排除,最终经由自反思机制对剩余假设进行概率排序,输出符合临床思维路径的诊疗建议

  • 基于 Monte-Carlo Tree Search 进行推理的几个问题:缺乏多样性、树结构退化以及无法利用前序探索路径

  • 临床推理中的 state 和 action 定义,以及基于此进行的 Process Reward Model 数据标注

  • 在没有 R1 的世界大杀四方,Recall “The Bitter Lesson"

5. 展望

  • 重谈场景的摩尔定律(杨植麟 vs 闫俊杰)

  • 大模型是否比我们更靠近终极真理?大模型智能与人类智能的差异表现


您认为,这样的技术在实践过程中有哪些痛点?

  • 专家的稀缺性对 RLHF 范式的根本挑战

  • 通用技术进步的曲线仍然很陡峭的情况下,垂直领域难以构建壁垒


演讲亮点

  • 一站式回顾大语言模型训练的底层数学机理和推理技术发展

  • 对大语言模型与人类在智能方面表现差异的初步讨论


听众收益

  • 深入了解大语言模型的训练和推理技术的发展脉络

  • 获得如何将大语言模型应用到垂直领域的实践经验


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-25 08:003662

评论

发布
暂无评论

SSM整合(功能模块的开发)

十八岁讨厌编程

Java ssm 后端开发 9月月更

软件测试 | 测试开发 | 一文搞定 Postman 接口自动化测试

测吧(北京)科技有限公司

测试

JS-内置对象API-Array(数组)-(二)-不改变原数组的API-篇

Sam9029

JavaScript 前端 9月月更

EMQ走进亚马逊云科技:携手云端,共筑「面向未来」的IoT基础设施底座

EMQ映云科技

物联网 IoT 解决方案 亚马逊云科技 9月月更

Ubuntu服务器上部署Kubernetes集群

CTO技术共享

软件测试 | 测试开发 | 一文彻底理解 Cookie、Session、Token

测吧(北京)科技有限公司

测试

用户组角色绑定(原生element-plus-ui表格)

青柚1943

Element Plus Vue3 Typescript

大厂校招SSP获得者—张金瑞 :开源项目,求职者的最佳简历|《大神详解开源 BUFF 增益攻略》讲座回顾

Apache IoTDB

开源 求职 Apache IoTDB 企业号九月金秋榜

[SSM]SSM整合①(整合配置)

十八岁讨厌编程

Java 后端开发 9月月更

软件测试 | 测试开发 | 《穿越时空的git》之创建版本库和常用命令操作

测吧(北京)科技有限公司

测试

性能测试知识科普(二):测试策略

老张

性能测试

阿里MaxCompute生态团队负责人—李睿博 : 参与开源,让自己的履历与众不同|《大神详解开源 BUFF 增益攻略》讲座回顾

Apache IoTDB

数据库 线上讲座 Apache IoTDB 企业号九月金秋榜

深入理解MYSQL之缓存

C++后台开发

MySQL 数据库 缓存 中间件 后端开发

数据平台发展史-从数据仓库数据湖到数据湖仓

明哥的IT随笔

hadoop spark 数据仓库 数据湖 湖仓一体

数字化转型新抓手:一看就懂的《企业应用现代化行动指南》(附下载)

York

容器 微服务 云原生 应用现代化

跟着卷卷龙一起学Camera--CCM

卷卷龙

ISP 9月月更

干货分享|使用 Istio 实现灰度发布

北京好雨科技有限公司

istio #Kubernetes#

阿里云PolarDB-X 荣获“2022 OSCAR 尖峰开源项目及开源社区”奖

阿里云数据库开源

阿里云 分布式数据库 开源数据库 PolarDB-X 可信开源

springboot搭建基于minio的高性能存储

CTO技术共享

40 岁程序员会有哪些肺腑之言?这篇文章告诉你

宇宙之一粟

学习 程序员 读书感悟 9月月更

Saas企业数字化必不可少的工具——帮助中心

Baklib

SaaS 企业 数字化 帮助中心

个推直播预告:9月26日,一线专家分享APP数字化运营方法与实践

个推

数字化 用户画像 标签体系

软件测试 | 测试开发 | 不懂PO 设计模式?这篇实战文带你搞定 PO

测吧(北京)科技有限公司

测试

Onedev v7.4.14 路径遍历漏洞分析(CVE-2022-38301)

墨菲安全

网络安全 开发安全 漏洞分析 软件供应链安全

开发者有话说 | 一个普通人的前端职业成长之路

范文杰

个人成长

kube-prometheus 监控系统使用与总结

CTO技术共享

RAID(独立冗余磁盘阵列)

阿柠xn

Linux 运维 操作系统 raid 9月月更

搭建在线帮助中心是企业最重要的第一步

Baklib

企业 在线文档 帮助中心 帮助文档

【Vue2】简易Vue2-简易图书借阅管理

Sam9029

Vue 前端 9月月更

计算机网络——封装成帧和透明传输

StackOverflow

编程 计算机网络 9月月更

获得多家大厂SSP的清华应届毕业生—田原:大厂各轮面试中开源经验有什么用|《大神详解开源 BUFF 增益攻略》讲座回顾

Apache IoTDB

数据库 开源 求职 Apache IoTDB 企业号九月金秋榜

百川智能研究小组负责人阎栋确认出席QCon北京站,分享大语言模型在医疗临床的推理实践_AI&大模型_QCon全球软件开发大会_InfoQ精选文章