写点什么

百川智能研究小组负责人阎栋确认出席 QCon 北京站,分享大语言模型在医疗临床的推理实践

  • 2025-03-25
    北京
  • 本文字数:1374 字

    阅读完需:约 5 分钟

大小:734.95K时长:04:10
百川智能研究小组负责人阎栋确认出席QCon北京站,分享大语言模型在医疗临床的推理实践

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


百川智能研究小组负责人阎栋已确认出席并发表题为《Learn to Reason : The way of Baichuan-M1-ClinicReasoning》的主题分享。在代码、数学等需要强大推理能力的领域,大语言模型已经走出实验室走向实践。医疗领域中的临床推理,要求模型基于强大推理能力,将艰深的医学知识灵活应用到对病人病情的分析和检验检查结果的解读上,从而最终获得正确的诊断。本次演讲将从合情推理开始展开介绍,首先回顾强化学习视角下的大语言模型训练的数学基础,然后以 Deepseek R1 为例梳理大语言模型推理技术的发展,再进一步展开介绍百川智能研究小组在训练大语言模型进行临床推理的实践,最后讨论如何继续提升模型能力的可能方向以及大语言模型与人类在智能上的差异表现。


阎栋博士毕业于清华大学计算机系,主要从事决策算法/系统和大语言模型对齐/推理方面的研究,在 ICLR、ICML、IJCAI、AAAI、JMLR、Pattern Recognition 等会议/期刊发表论文数十篇。他带领团队基于 RLHF 增强的大语言模型 Baichuan3,在 2024 年 4 月份的 Superclue 评测中荣获国内第一;开发的深度诊断模型 Baichuan-M1-ClinicReasoning,已上线百小应 APP 和百方医生小程序,并以小于 Deepseek R1 一个数量级的模型大小,在临床推理场景下达到与 R1 相当的性能。他在本次会议的详细演讲内容如下:


演讲提纲

1. 推理:真实世界中的合情推理

2. 序章:强化学习视角下的大语言模型训练

  • 在充满噪声的反馈回路下,带着镣铐学习跳舞

  • 模仿学习、演示学习和偏好学习

3. 脉络:大语言模型的推理技术的发展,以 Deepseek R1 为例

  • 少有人走的路:代码、数学和通用

  • R1-Zero 带来的启示:Test Time Scaling 和 SFT Seed

4. 临床:医疗的内生复杂性,推理能力 + 领域知识的临床推理范式

  • 临床推理范式:生成诊疗假设,继而通过检验检查数据进行假设证伪与排除,最终经由自反思机制对剩余假设进行概率排序,输出符合临床思维路径的诊疗建议

  • 基于 Monte-Carlo Tree Search 进行推理的几个问题:缺乏多样性、树结构退化以及无法利用前序探索路径

  • 临床推理中的 state 和 action 定义,以及基于此进行的 Process Reward Model 数据标注

  • 在没有 R1 的世界大杀四方,Recall “The Bitter Lesson"

5. 展望

  • 重谈场景的摩尔定律(杨植麟 vs 闫俊杰)

  • 大模型是否比我们更靠近终极真理?大模型智能与人类智能的差异表现


您认为,这样的技术在实践过程中有哪些痛点?

  • 专家的稀缺性对 RLHF 范式的根本挑战

  • 通用技术进步的曲线仍然很陡峭的情况下,垂直领域难以构建壁垒


演讲亮点

  • 一站式回顾大语言模型训练的底层数学机理和推理技术发展

  • 对大语言模型与人类在智能方面表现差异的初步讨论


听众收益

  • 深入了解大语言模型的训练和推理技术的发展脉络

  • 获得如何将大语言模型应用到垂直领域的实践经验


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-25 08:003479

评论

发布
暂无评论

程序员,到底要懂多少业务?

秃头小帅oi

火山引擎VeDI数据技术分享:两个步骤,为Parquet降本提效

字节跳动数据平台

云服务 数据平台 火山引擎 数据飞轮

写报告 进图谱 做演讲,可信数据库大会上亚信科技AntDB可太忙了

亚信AntDB数据库

澳鹏Appen入选大模型产业链基础层图谱及案例研究

澳鹏Appen

大模型训练 大模型 百模大战

云原生代表技术(1)-不可变基础设施

虚实的星空

大咖公开课 | 大模型场景讲解以及测试方法

测吧(北京)科技有限公司

测试

电商平台集成:京东商品详情API的应用实践

技术冰糖葫芦

API 文档 API 测试 API 优先 API Hub

使用IPIDEA海外代理助力宠物跨境电商

热爱编程的小白白

MySQL 备库可以设置 sync_binlog 非 1 吗?

爱可生开源社区

MySQL 数据库 MySQL主从复制

商品图片与详情描述:1688 API返回值的重要部分

技术冰糖葫芦

API 文档 API 测试 API 优先 API Hub

智胜未来:国内大模型+Agent应用案例精选,以及主流Agent框架开源项目推荐

不在线第一只蜗牛

人工智能 AI

如何借助逻辑数据编织平台实现“数据优先堆栈( DFS )”

Aloudata

数据仓库 数据虚拟化 数据编织

Vehicle + UNS : 为 SDV 提供全生命周期的数据可互操作性

EMQ映云科技

车联网 mqtt 软件定义汽车 emqx

【YashanDB知识库】设置归档日志上限,但归档日志没自动清理,导致磁盘空间满

YashanDB

yashandb 崖山数据库 崖山DB

《饿殍:明末千里行》PC+手机版分享,高达97%的好评率。

你的猪会飞吗

单机游戏

大咖公开课 | 大模型场景讲解以及测试方法

霍格沃兹测试开发学社

全面解析:抖音商品列表数据接口的使用与集成技巧

tbapi

抖音 抖音商品列表数据接口 抖音商品列表数据采集 抖音API接口

Kubernetes集群的ETCD分布式数据库高可用原理解析

inBuilder低代码平台

开源 云原生 Kubernetes, 云原生, eBPF

【YashanDB知识库】使用select * 创建的物化视图无法进行查询重写

YashanDB

yashandb 崖山数据库 崖山DB

HAProxy 可观测性最佳实践

观测云

HAProxy

百川智能研究小组负责人阎栋确认出席QCon北京站,分享大语言模型在医疗临床的推理实践_AI&大模型_QCon全球软件开发大会_InfoQ精选文章