10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

大模型“四虎”出山,亮相 4 月 QCon 北京站

  • 2025-03-03
    北京
  • 本文字数:2992 字

    阅读完需:约 10 分钟

大模型“四虎”出山,亮相4月QCon北京站

过去一年里,从激烈的“百模大战”中跑出了大模型“六小虎”——南有阶跃、北有智谱,此外还有月之暗面、百川智能、MiniMax、零一万物环伺。


进入 2025 年,随着 DeepSeek 的爆火出圈,大模型领域的硝烟显然只增不减。但不同企业的战略定位和落地模式也逐步呈现出了差异化。比如,被并称为“基模双雄”的阶跃星辰和智谱坚定地追求 AGI(通用人工智能),月之暗面和 MiniMax 的战略优先级是 C 端产品和应用,百川智能锚定医疗方向,零一万物也聚焦行业模型,拓展 to B 的数字人解决方案。


具体技术实践和产品落地进展如何?即将在 4 月 10 日-4 月 12 日举办的QCon全球软件开发大会北京站上,阶跃星辰、智谱、月之暗面、百川智能这大模型“四虎”将齐齐亮相,带来他们的最新技术成果。

阶跃星辰:SoTA 模型的技术创新与架构优势


多模态是阶跃星辰的最大特色。近日,阶跃星辰宣布开源了两款 Step 系列多模态模型——Step-Video-T2V 视频生成模型和 Step-Audio 语音交互模型。据透露,阶跃星辰还将在 3 月开源公司自研的图生视频模型。


在 QCon 北京站上,阶跃星辰 Tech Fellow 段楠将重点介绍 Step-Video,带来《Step-Video 开源模型:视频生成基础模型的最新进展、挑战与未来展望》的主题分享。围绕 Step-Video 系列开源模型,段楠将介绍视频生成基础模型的最新进展,包括文生视频和图生视频等任务。此外,本报告还将总结现有视频生成模型面临的主要挑战,并讨论未来可能的发展发向。


演讲提纲:

1. 视频生成背景和现状

  • 视频生成从简单的帧插值逐渐演变为复杂的多模态生成任务

  • 多模态融合(文本、图像、音频等)、大规模预训练模型的应用逐渐成为趋势

2. 视频生成 SoTA 模型:Step-Video

  • 技术亮点

  • 实验结果:性能对比、案例分析

  • 视频生成目前面临的挑战

3. 关于未来的讨论

  • 更强大的多模态融合

  • 实时生成

智谱 AI:大模型自主智能体的发展


智谱 AI 在 AI Agent 技术领域取得了一系列突破进展。比如去年 11 月发布的 AutoGLM 已经可以支持执行超过 50 步的复杂任务,支持跨应用操作和全自动上网功能;今年 1 月发布的最新的 AI 智能体“AgentGLM-PC1.1”,具备深度思考能力,能够生成思维链以拆解复杂任务,并通过代码机制提升推理能力;2 月上线的全新一代智能代理模型 GLM-PC 1.1,可以提供会议替身、文档处理、隐形屏幕等系统级功能,在复杂任务处理与多模态交互领域取得了新的技术突破。


在 QCon 北京站上,智谱 AI AutoGLM 部门负责人刘潇 将带来《大模型自主智能体的发展:以 Phone Use 和 Computer Use 智能体为例》的主题分享,介绍从 GPT-3 开始,大语言自主智能体的概念和发展的 3 个阶段,重点介绍第 3 阶段,即当前正在发展中的基于 GUI 和推理模型的大模型自主智能体。相比此前的对话智能体和基于 Workflow 的智能体,自主智能体将实现通用的智能代理能力,走出场景特化的局限性。报告将重点介绍 Phone Use 和 Computer Use 自主智能体的发展情况,比较这些方案的优劣,以及在实际例子上的表现,并且探讨接下来的大模型自主智能体发展的方向。


演讲提纲:

1. 引言

  • 大语言模型的崛起与能力背景

  • 自主智能体的定义与重要性

2. 大语言自主智能体的发展历程

  • 大模型智能体的第一/二阶段:


  • 基于非自主工具调用的大模型智能体

  • 基于系统提示和 Workflow 工具调用的大模型智能体(GPTs)

  • 系统提示与 Workflow 工具调用的原理

  • 实际应用案例与效果展示

  • 基于 GUI 和推理模型的大模型自主智能体(发展中)

  • 最新进展与技术亮点

  • GUI 和推理模型的集成方式

  • 当前阶段的挑战与解决方案

  • 初步应用与前景展望

3. 方案比较与实际表现

  • 三种方案的优劣对比

  • 在不同场景下的实际表现分析

  • 用户反馈与评价

4. 大模型自主智能体的发展方向

  • 技术趋势与未来展望

  • 潜在的应用领域与市场机会

  • 研究与发展的挑战与对策

月之暗面:大规模集群训推混部经验及框架侧优化


近日,月之暗面推出了全新的优化器 Muon,Scaling law 实验表明,与计算最优训练的 AdamW 相比,Muon 的计算效率提升了 2 倍。基于此,月之暗面还训练出了 3B/16B 参数的 混合专家模型(MoE)——Moonlight,训练数据量达 5.7T tokens。通过 Muon 优化器和 Moonlight 模型,月之暗面重新定义了高效训练与性能的平衡,同时在长文本处理领域提出创新架构。


在 QCon 北京站上,月之暗面系统工程师黄维啸将带来《月之暗面稳定高效的 LLM 基础设施构建之道》的主题分享,具体介绍月之暗面在训推混部集群中的实践经验,重点探讨如何快速定位并隔离故障,实现任务的高效恢复,从而提升系统整体稳定性。同时,黄维啸还将分享如何在资源有限的情况下最大化利用率,避免浪费,进一步将该思路应用于强化学习任务的训练中。


演讲提纲:

1. 大规模训练推理集群的挑战

  • 大规模集群中机器故障频率高,任务失败率高

  • 推理场景中的用户请求具备潮汐效应

  • 强化学习场景存在资源浪费情况

2. 提高训推混部集群稳定性和资源利用率

  • 任务检查点的高效存储和回复

  • 故障节点快速发现和隔离,提高训练可观察性,快速找到慢节点

  • 潮汐优先级调度,最大化提高资源利用率

3. 通过混合架构提高强化学习效率

  • 混合 Sidecar 部署架构

  • 训推任务高效切换

百川智能:大语言模型落地垂直领域的实践经验


百川智能近期的技术路线主要集中于全模态能力突破、医疗等垂直领域的深化及产业生态扩展,通过开源与产学研合作加速技术落地。3 月 2 日,百川开源了全模态模型 Baichuan-Omni-1.5,支持文本、图像、音频、视频的全模态理解及文本/音频生成,数据显示,在视觉、语音、多模态流式处理等场景其表现超过 GPT-4o mini,尤其在医疗多模态评测集(如 GMAI-MMBench、OpenMM-Medical)中大幅领先。


在 QCon 北京站上,百川智能研究小组负责人阎栋将带来《Learn to Reason : The way of Baichuan-M1-ClinicReasoning》的主题分享,从介绍合情推理开始,首先回顾强化学习视角下的大语言模型训练的数学基础,然后以 Deepseek R1 为例梳理大语言模型推理技术的发展,再介绍百川智能研究小组在训练大语言模型进行临床推理的实践,最后讨论如何继续提升模型能力的可能方向以及大语言模型与人类在智能上的差异表现。


演讲提纲:

1. 推理:真实世界中的合情推理

2. 序章:强化学习视角下的大语言模型训练

  • 在充满噪声的反馈回路下,带着镣铐学习跳舞

  • 模仿学习、演示学习和偏好学习

3. 脉络:大语言模型的推理技术的发展,以 Deepseek R1 为例

  • 少有人走的路:代码、数学和通用

  • R1-Zero 带来的启示:Test Time Scaling 和 SFT Seed

4. 临床:医疗的内生复杂性,推理能力 + 领域知识的临床推理范式

  • 临床推理范式:生成诊疗假设,继而通过检验检查数据进行假设证伪与排除,最终经由自反思机制对剩余假设进行概率排序,输出符合临床思维路径的诊疗建议

  • 基于 Monte-Carlo Tree Search 进行推理的几个问题:缺乏多样性、树结构退化以及无法利用前序探索路径

  • 临床推理中的 state 和 action 定义,以及基于此进行的 Process Reward Model 数据标注

  • 在没有 R1 的世界大杀四方,Recall “The Bitter Lesson"

5. 展望

  • 重谈场景的摩尔定律(杨植麟 vs 闫俊杰)

  • 大模型是否比我们更靠近终极真理?大模型智能与人类智能的差异表现


除了阶跃星辰、智谱、月之暗面、百川智能之外,还有来自百度、阿里、腾讯、华为、字节跳动、小红书、小米、美团、饿了么等企业的 100+资深专家将出席4月QCon北京站,聚焦大模型背景下的 AI 研发基础设施重构、工程生产力升级、组织管理创新、AI 搜索实践、大模型安全,以及多模态大模型及应用和技术人成长等话题进行议题分享。


更多议题内容可查看完整日程:https://qcon.infoq.cn/2025/beijing/schedule

2025-03-03 16:395886

评论

发布
暂无评论

工程师文化落地的几点思考

baiyutang

敏捷 敏捷开发 精益开发 精益思想 敏捷管理

如何使用 Kind 快速创建 K8s 集群?

尔达Erda

开源 云原生 k8s PaaS kind

认识容器,我们从它的历史开始聊起

华为云开发者联盟

Docker Kubernetes 容器 进程

鉴释×中科院计算所丨OS2ATC 2020精彩回顾

鉴释

开源 操作系统

我们该如何应对日益增长的安全债务风险?

鉴释

应用安全 代码安全

BoCloud博云:ESB老旧力不能支,微服务独立自治强势替代

BoCloud博云

微服务

性能测试误差对比研究(二)

FunTester

性能测试 压测 接口测试 测试框架 误差分析

鉴释人物丨专访首席科学家李隆: 重一步业务逻辑验证,省百步漏洞补缺

鉴释

业务逻辑 漏洞修复

揭秘百度微服务监控:百度游戏服务监控的演进

百度开发者中心

云计算 微服务 最佳实践 方法论 云原生

直播回顾丨鉴释首席架构师刘新铭为您解读“第一性原则”

鉴释

软件开发 代码质量 软件质量与安全

【报名】百度EasyDL研讨会:揭秘智能化硬件AI应用的技术难点与行业落地

百度大脑

人工智能 智能化

论工作几年深陷业务代码的程序员如何实现自我提升

北游学Java

Java 程序人生

鉴释×RT-Thread丨2020 RT-Thread开发者大会精彩回顾

鉴释

操作系统 物联网

CloudQuery 如何实现云上数据导入导出

BinTools图尔兹

数据库 dba 国产数据库 运维开发

fil价格今日行情?2021年fil币预估价格多少钱一枚?

区块链 分布式存储 IPFS fil价格 fil预测

鉴释人物丨专访首席技术官陈新中:三十年磨一“鉴”, 打造静态代码分析行业标杆

鉴释

编译器 静态代码分析

图灵奖得主Judea Pearl谈机器学习:不能只靠数据

百度开发者中心

机器学习 最佳实践 方法论 文化 & 方法 其他

51CTO专访|鉴释首席架构师刘新铭:让软件开发更安全、更高效

鉴释

编译器

鉴释人物 | 专访产品开发总监吴翔:DevSecOps的竞技之道

鉴释

敏捷开发 应用安全 软件安全 软件质量与安全

创业邦专访丨兼容国内外市场的代码分析软件,鉴释科技帮助企业减少bug发生率

鉴释

创业公司

六种主要服务器管理协议简单概述-行云管家

行云管家

行云管家 服务器协议 服务器管理

性能测试误差对比研究(一)

FunTester

性能测试 接口测试 测试框架 误差分析

架构实战训练营模块三课后作业

Clarke

百度前端三面面试题全部公开,三面的最后一个问题令我窒息

前端依依

百度 面试 大前端 经验总结

成为Linux大佬的学习之路-规划

学神来啦

Linux 运维 linux运维 linux学习

第八周作业——知识星球内容管理功能

小夏

产品经理训练营 邱岳

RTC月度小报5月丨教育aPaaS灵动课堂升级、抢先体验VUE版 Agora Web SDK、声网Agora与HTC达成合作

声网

月度小报 行业深度

我们三岁啦!

鉴释

2021全国人工智能师资培训走进北理工,百度飞桨助力高校教师提升AI能力

百度大脑

人工智能 高校

围观|解读新一代企业数字化架构的“三驾马车”

尔达Erda

开源 DevOps 云原生 数字化转型 数字化

鉴释课堂丨编译器技术入门知识一网打尽

鉴释

编译器 编译器原理

大模型“四虎”出山,亮相4月QCon北京站_AI&大模型_QCon全球软件开发大会_InfoQ精选文章