大厂Data+Agent 秘籍:腾讯/阿里/字节解析如何提升数据分析智能。 了解详情
写点什么

百川智能研究小组负责人阎栋确认出席 QCon 北京站,分享大语言模型在医疗临床的推理实践

  • 2025-03-25
    北京
  • 本文字数:1374 字

    阅读完需:约 5 分钟

大小:734.95K时长:04:10
百川智能研究小组负责人阎栋确认出席QCon北京站,分享大语言模型在医疗临床的推理实践

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


百川智能研究小组负责人阎栋已确认出席并发表题为《Learn to Reason : The way of Baichuan-M1-ClinicReasoning》的主题分享。在代码、数学等需要强大推理能力的领域,大语言模型已经走出实验室走向实践。医疗领域中的临床推理,要求模型基于强大推理能力,将艰深的医学知识灵活应用到对病人病情的分析和检验检查结果的解读上,从而最终获得正确的诊断。本次演讲将从合情推理开始展开介绍,首先回顾强化学习视角下的大语言模型训练的数学基础,然后以 Deepseek R1 为例梳理大语言模型推理技术的发展,再进一步展开介绍百川智能研究小组在训练大语言模型进行临床推理的实践,最后讨论如何继续提升模型能力的可能方向以及大语言模型与人类在智能上的差异表现。


阎栋博士毕业于清华大学计算机系,主要从事决策算法/系统和大语言模型对齐/推理方面的研究,在 ICLR、ICML、IJCAI、AAAI、JMLR、Pattern Recognition 等会议/期刊发表论文数十篇。他带领团队基于 RLHF 增强的大语言模型 Baichuan3,在 2024 年 4 月份的 Superclue 评测中荣获国内第一;开发的深度诊断模型 Baichuan-M1-ClinicReasoning,已上线百小应 APP 和百方医生小程序,并以小于 Deepseek R1 一个数量级的模型大小,在临床推理场景下达到与 R1 相当的性能。他在本次会议的详细演讲内容如下:


演讲提纲

1. 推理:真实世界中的合情推理

2. 序章:强化学习视角下的大语言模型训练

  • 在充满噪声的反馈回路下,带着镣铐学习跳舞

  • 模仿学习、演示学习和偏好学习

3. 脉络:大语言模型的推理技术的发展,以 Deepseek R1 为例

  • 少有人走的路:代码、数学和通用

  • R1-Zero 带来的启示:Test Time Scaling 和 SFT Seed

4. 临床:医疗的内生复杂性,推理能力 + 领域知识的临床推理范式

  • 临床推理范式:生成诊疗假设,继而通过检验检查数据进行假设证伪与排除,最终经由自反思机制对剩余假设进行概率排序,输出符合临床思维路径的诊疗建议

  • 基于 Monte-Carlo Tree Search 进行推理的几个问题:缺乏多样性、树结构退化以及无法利用前序探索路径

  • 临床推理中的 state 和 action 定义,以及基于此进行的 Process Reward Model 数据标注

  • 在没有 R1 的世界大杀四方,Recall “The Bitter Lesson"

5. 展望

  • 重谈场景的摩尔定律(杨植麟 vs 闫俊杰)

  • 大模型是否比我们更靠近终极真理?大模型智能与人类智能的差异表现


您认为,这样的技术在实践过程中有哪些痛点?

  • 专家的稀缺性对 RLHF 范式的根本挑战

  • 通用技术进步的曲线仍然很陡峭的情况下,垂直领域难以构建壁垒


演讲亮点

  • 一站式回顾大语言模型训练的底层数学机理和推理技术发展

  • 对大语言模型与人类在智能方面表现差异的初步讨论


听众收益

  • 深入了解大语言模型的训练和推理技术的发展脉络

  • 获得如何将大语言模型应用到垂直领域的实践经验


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-25 08:003587

评论

发布
暂无评论

终于彻底搞清楚了 MySQL spin-lock 之一次CPU问题定位过程总结

Java 程序员 后端

老生常谈:MySQL高可用,java泛型原理

Java 程序员 后端

精心整理全网最全Tomcat面试专题及答案(共19题,含答案解析

Java 程序员 后端

精通springcloud:服务发现,Eureka API,java技术上难以解决的问题

Java 程序员 后端

线上环境大规模RocketMQ集群不停机优雅升级实践,面试字节跳动Java工程师该怎么准备

Java 程序员 后端

[ CloudWeGo 微服务实践 - 04 ] 尝试操作数据(1)

baiyutang

golang 微服务 10月月更

老板,运维和开发又打起来了!,你连基础的JVM运行时内存布局都忘了

Java 程序员 后端

算法宝典最新分享:Alibaba+小米,redis笔记

Java 程序员 后端

精心备战30天,三天斩获阿里offer,揭秘面试流程及我的学习方向

Java 程序员 后端

系统性能典型案例分析:高性能队列Disruptor,一文深入理解

Java 程序员 后端

缓存穿透及解决方案(干货篇),java基础入门第二版第二章答案

Java 程序员 后端

精雕细琢!阿里大师53天悉心打磨出来的MyBatis+设计模式架构指南

Java 程序员 后端

系统性能百倍提升典型案例分析:高性能队列Disruptor(1)

Java 程序员 后端

网关性能大PK,Spring Cloud Gateway让人大失所望!,java教程pdf百度云下载

Java 程序员 后端

群晖DS218+做maven私服(nexus3),mysql性能调优

Java 程序员 后端

系统性能典型案例分析:高性能队列Disruptor,一文深入理解(1)

Java 程序员 后端

系统性能百倍提升典型案例分析:高性能队列Disruptor,linux服务器架构师

Java 程序员 后端

网页制作工具之------Dreamweaver界面,springmvc教程下载

Java 程序员 后端

老大让我优化数据库,我上来就分库分表,他过来就是一jio

Java 程序员 后端

聊聊MyBatis的历史,mysql原理详解

Java 程序员 后端

终于彻底搞清楚了 MySQL spin-lock 之一次CPU问题定位过程总结(1)

Java 程序员 后端

绝杀!3位阿里大牛发布这份800页MySQL性能优化法则笔记

Java 程序员 后端

网络协议从入门到底层原理(11)网络爬虫,线程池底层实现原理

Java 程序员 后端

网络协议从入门到底层原理(5)传输层,java编程项目实例教程

Java 程序员 后端

网络编程六-网络编程相关面试题汇总,nginx运行原理

Java 程序员 后端

类加载器深入剖析,2021最新华为Java校招面试题

Java 程序员 后端

绝了!你一直想要的数据库界的里程碑,Alibaba技术官内部私藏MySQL笔记

Java 程序员 后端

老夫面试两个月真实经历:面试了20家大厂之后,发现这样介绍项目经验

Java 程序员 后端

老面试官问我:LRU 和 Innodb Buffer Pool 有什么关系?

Java 程序员 后端

终于等到了!十位Java架构师整理的“阿里P7,看完老板哭着让我留下来

Java 程序员 后端

美团二面:聊聊线程池设计与原理,由表及里趣味解析,linux操作系统实用教程课后答案

Java 程序员 后端

百川智能研究小组负责人阎栋确认出席QCon北京站,分享大语言模型在医疗临床的推理实践_AI&大模型_QCon全球软件开发大会_InfoQ精选文章