2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

Step-Video 开源模型:视频生成基础模型的最新进展、挑战与未来展望|QCon 北京

  • 2025-03-17
    北京
  • 本文字数:818 字

    阅读完需:约 3 分钟

Step-Video 开源模型:视频生成基础模型的最新进展、挑战与未来展望|QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


阶跃星辰 Tech Fellow 段楠已确认出席并发表题为Step-Video 开源模型:视频生成基础模型的最新进展、挑战与未来展望的主题分享,本演讲将围绕 Step-Video 系列开源模型,介绍视频生成基础模型的最新进展,包括文生视频和图生视频等任务。此外,本报告还将总结现有视频生成模型面临的主要挑战,并和大家讨论未来可能的发展发向。


段楠博士现任阶跃星辰 Tech Fellow ,带领研究团队构建以语言和视频为中心的多模态基础模型。此前,他曾任微软亚洲研究院资深首席研究员、自然语言计算团队研究经理( 2012 年至 2024 年)。段博士是中国科学技术大学和西安交通大学兼职博导,天津大学兼职教授。主要从事自然语言处理、代码智能、多模态基础模型、智能体等研究。他在本次会议的详细演讲内容如下:


演讲提纲

1. 视频生成背景和现状

  • 视频生成从简单的帧插值逐渐演变为复杂的多模态生成任务

  • 多模态融合(文本、图像、音频等)、大规模预训练模型的应用逐渐成为趋势

2. 视频生成 SoTA 模型:Step-Video

  • 技术亮点

  • 实验结果:性能对比、案例分析

  • 视频生成目前面临的挑战

3. 关于未来的讨论

  • 更强大的多模态融合

  • 实时生成

您认为,这样的技术在实践过程中有哪些痛点?

  • 高质量数据的获取、训练和推理效率、物理规律的遵循

演讲亮点

  • SoTA 模型的技术创新与架构优势

  • 系统优化与高效训练

听众收益

  • 了解该领域最新进展


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-17 18:435025

评论

发布
暂无评论

CodeWhisperer 史上最强大的 AI 编程助手!!

亚马逊云科技 (Amazon Web Services)

Java Python 人工智能 云上探索实验室 Amazon CodeWhisperer

百度智能云正式上线Python SDK版本并全面开源!

爱编程的喵喵

Linux软件包(源码包和二进制包)

芯动大师

项目开发老板的预算低,华为云这款轻量应用服务便宜又好用

平平无奇爱好科技

“轻”而不“弱”,华为云耀云服务器L实例引领轻量应用新时代

轶天下事

Util应用框架核心(一)- 服务配置

何镇汐

开源 后端

批量网站建设成本太高?华为云“神器”轻量应用服务器破解困局

YG科技

大厂都在用的运营_秘诀_,华为云这款产品让小程序开发价值脱颖而出!

YG科技

甲方“爸爸”又加开发需求,华为云这款轻量应用服务器解燃眉之急

轶天下事

Util应用框架核心(二)- 启动器

何镇汐

开源 后端

临时项目人员空缺,华为云耀云服务器L实例江湖救急

平平无奇爱好科技

新手站长如何选择云服务器?华为云耀云服务器L实例值得拥有

轶天下事

Go,14周年

Tony Bai

Go golang 编程 编程语言 go语言

华为云耀云服务器L实例在中小企业里爆“火”,掌握使用技巧效率翻倍

YG科技

让程序猿轻松告别996,华为云这款轻量应用服务器火了

平平无奇爱好科技

Util应用框架核心(三)- 服务注册器

何镇汐

开源 后端

GPT最佳实践:五分钟打造你自己的GPT

caiyongji

openai GPT ChatGPT

Get Backup Pro 3 注册密钥激活 附 安装教程 支持M1

彩云

数据备份 Get Backup Pro 3

外贸新手如何做好网站?华为云耀云服务器L实例轻松“避雷”

平平无奇爱好科技

开发人员的私人助手:亚马逊CodeWhisperer

阿呆

Amazon CodeWhisperer

文心耀乌镇,“大模型之光”展现了什么?

脑极体

AI

mac电脑端Git客户端 Fork 激活最新版

胖墩儿不胖y

git Mac软件 Git客户端

Macos网络文件安全共享工具:Dropshare 5 「支持M1」

彩云

Dropshare 5

【亚马逊云科技产品测评】活动征文|10分钟拥有一台AWS Linux系统

青花锁

Linux AWS EC2

Aws EC2系统上搭建Echarts大屏展示项目

青花锁

AWS EC2

把“上云”变成一件简单事情,华为云这款轻量应用服务器大有乾坤

YG科技

“断崖式”客户预算和客户要求,华为云耀云服务器L实例填平鸿沟!

轶天下事

Python MySQL 数据库查询:选择数据、使用筛选条件、防止 SQL 注入

小万哥

Python 程序员 软件 后端 开发

另辟蹊径者 PoseiSwap:背靠潜力叙事,构建 DeFi 理想国

股市老人

如何降低开发测试成本?华为云这个宝藏工具值得一试!

YG科技

Step-Video 开源模型:视频生成基础模型的最新进展、挑战与未来展望|QCon北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章