2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

Step-Video 开源模型:视频生成基础模型的最新进展、挑战与未来展望|QCon 北京

  • 2025-03-17
    北京
  • 本文字数:818 字

    阅读完需:约 3 分钟

Step-Video 开源模型:视频生成基础模型的最新进展、挑战与未来展望|QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


阶跃星辰 Tech Fellow 段楠已确认出席并发表题为Step-Video 开源模型:视频生成基础模型的最新进展、挑战与未来展望的主题分享,本演讲将围绕 Step-Video 系列开源模型,介绍视频生成基础模型的最新进展,包括文生视频和图生视频等任务。此外,本报告还将总结现有视频生成模型面临的主要挑战,并和大家讨论未来可能的发展发向。


段楠博士现任阶跃星辰 Tech Fellow ,带领研究团队构建以语言和视频为中心的多模态基础模型。此前,他曾任微软亚洲研究院资深首席研究员、自然语言计算团队研究经理( 2012 年至 2024 年)。段博士是中国科学技术大学和西安交通大学兼职博导,天津大学兼职教授。主要从事自然语言处理、代码智能、多模态基础模型、智能体等研究。他在本次会议的详细演讲内容如下:


演讲提纲

1. 视频生成背景和现状

  • 视频生成从简单的帧插值逐渐演变为复杂的多模态生成任务

  • 多模态融合(文本、图像、音频等)、大规模预训练模型的应用逐渐成为趋势

2. 视频生成 SoTA 模型:Step-Video

  • 技术亮点

  • 实验结果:性能对比、案例分析

  • 视频生成目前面临的挑战

3. 关于未来的讨论

  • 更强大的多模态融合

  • 实时生成

您认为,这样的技术在实践过程中有哪些痛点?

  • 高质量数据的获取、训练和推理效率、物理规律的遵循

演讲亮点

  • SoTA 模型的技术创新与架构优势

  • 系统优化与高效训练

听众收益

  • 了解该领域最新进展


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-17 18:435006

评论

发布
暂无评论

实时分析用户反馈:淘宝商品评论API助力电商创新

技术冰糖葫芦

API boy API 接口 API 测试

发挥财务规划隐藏的超能力,实现企业业务与财务的协作

智达方通

企业管理 全面预算管理 财务管理 财务规划

1688批量自动下单接口丨1688代采系统丨1688跨境代采系统

tbapi

1688批量采购 1688代购系统

软件测试公开课 | Python高频面试题解析公开课

测试人

软件测试

斯坦福 AI 团队被曝抄袭中国大模型开源成果;Zoom 创始人谈视频会议未来丨 RTE 开发者日报 Vol.218

声网

深入剖析时序Prophet模型:工作原理与源码解析|得物技术

得物技术

时序数据库 源码剖析 大模型 企业号2024年6月PK榜 ptophet

利用Python调用KimiGPT API接口

我再BUG界嘎嘎乱杀

Python 后端 开发语言 GPT

淘宝商品详情API接口:轻松获取商品SKU信息,优化库存管理

技术冰糖葫芦

API boy API 接口 API 测试

工信部《工业和信息化领域数据安全风险评估实施细则(试行)》实行,行云管家数据产品助力企业数据安全

行云管家

信息安全 数据安全 数据安全管理

“码”力全开!高效开发就靠这款神器

ZEGO即构

UI 自定义组件 即构UIkits UIKits

告别繁琐,一键同步!聚道云助力企业人力资源大升级

聚道云软件连接器

案例分享

探索大模型技术及其前沿应用——TextIn文档解析技术

Yan-英杰

大模型 文档解析 文档解析技术

Stable diffusion采样器详解

程序那些事

程序那些事 Stable Diffusion

扫码报名活动时,如何避免重复报名?

草料二维码

二维码 活动报名 草料二维码

堡垒机的自动化运维,快速安全提升运维效率

行云管家

数据安全 堡垒机 自动化运维

如何将您的 API 管理从 Swagger 迁移到 Apifox:详细步骤

Apifox

Apifox 接口文档 API swagger API 文档

用Python打造你的微博热搜追踪器

我再BUG界嘎嘎乱杀

Python 后端 开发语言

Python高频面试题解析公开课

测吧(北京)科技有限公司

测试

数据觉醒时代,以“存力”激活数据资产潜能

优刻得云计算

大数据 数据要素流通

用这个方法给苹果电脑清理app垃圾,让电脑快如闪电

阿拉灯神丁

CleanMyMac Mac 系统 苹果软件 杀毒软件

保姆级教程:Redis主从复制原理及集群搭建

小曾同学.com

redis主从 redis哨兵集群 redis 底层原理 redis主从集群 redis数据同步原理

仓库数据同步难题如何轻松破解?

聚道云软件连接器

案例分享

Web3 游戏周报(5.26 - 6.01)

Footprint Analytics

链游

NFTScan 获 Google Cloud 战略支持!

NFT Research

Google Cloud NFT\ NFTScan

降本增效下的自动化测试实践

老张

软件测试 研发效能 自动化测试 质量保障

RESTful API 设计原则:优化您的接口设计

Liam

后端 Rest API APi设计 REST API

企业号 6 月 PK 榜,火热开启!

InfoQ写作社区官方

热门活动 企业号2024年6月PK榜

Step-Video 开源模型:视频生成基础模型的最新进展、挑战与未来展望|QCon北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章