写点什么

Infinity:视觉自回归生成新路线|AICon 北京

  • 2025-05-28
    北京
  • 本文字数:1110 字

    阅读完需:约 4 分钟

大小:592.99K时长:03:22
Infinity:视觉自回归生成新路线|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


字节跳动 AIGC 算法工程师韩剑已确认出席并发表题为《Infinity:视觉自回归生成新路线》的主题分享,探讨以 ChatGPT、DeepSeek 为代表的大语言模型(LLM)取得了巨大的成功,掀起了全球新一轮 AI 浪潮,但是在视觉生成领域,目前主流的方法却是一直以扩散模型为主导。与大语言模型采取相同技术路线的视觉自回归方法因为具有更好的 scaling 特性,能够统一理解 &生成任务,隐藏着巨大的潜力,正受到人们越来越多的重视。本次演讲中,韩剑将以被选为 CVPR 2025 Oral 的工作 Infinity 为例,详细介绍自回归视觉生成的底层技术原理。并以图像生成和视频生成两个具体场景,分享最新的研究成果和相关思考。



韩剑,硕士毕业于清华大学电子系,现就职于字节跳动商业化技术团队,该团队在视觉生成领域先后推出了 VAR、LllamaGen、Infinity、Goku 等多项重要研究成果。韩剑的主要研究方向为图像生成和视频生成,在自回归图像生成和视频生成领域积累了丰富的经验,其最新研究成果 Infinity 被选中在 CVPR 2025 上做口头报告。他在本次会议的详细演讲内容如下:


演讲提纲

1. 自回归模型和 Scaling Law

2. 视觉自回归 v.s. 扩散模型

3. Infinity:视觉自回归生成新路线

  • 离散 Visual Tokenizer

  • Bitwise AutoRegressive Modeling

  • 图像生成实践

  • 视频生成实践

4. 分析和思考


您认为,这样的技术在实践过程中有哪些痛点?目前看以 Infinity 为代表的视觉自回归模型在视频生成任务上相比 SOTA 的扩散模型生成速度具有明显优势,但是效果上还有一些差距。


您的演讲有哪些前沿亮点?这是一个非常详尽的视觉自回归技术分享,通过这次分享,读者可以深入了解到视觉自回归的底层技术实现、目前达到的效果水位,以及未来可能的研究方向。


听众收益

  • 视觉自回归的技术原理、实现方法、目前达到的生成效果

  • 视觉自回归技术的优缺点以及未来的发展方向

  • 如何基于视觉自回归构建图像/视频生成模型


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-05-28 14:003586

评论

发布
暂无评论

KCL v0.5.0 重磅发布 - 面向云原生场景更易用的语言、工具链,社区集成和扩展支持

Peefy

开源 DevOps 云原生 编程语言 Kubernetes Serverless

MVCC

陈皮

揭秘高新技术发展最新趋势,程序猿视角下的技术革新感悟 | 社区征文

三掌柜

年中技术盘点

AIGC第一波裁员已至

互联网工科生

人工智能 裁员 AIGC

敏捷领导力 (CAL E+O / ALJ) 认证

ShineScrum

生成式 AI:改变未来的力量| 社区征文

度假的小鱼

年中技术盘点

软件测试 | Java程序的运行机制和Java虚拟机

测吧(北京)科技有限公司

测试

全部免费!整理了10个Python自动化办公库!(下)

程序员晚枫

Python 工具 机器人 自动化办公

软件测试 | Java开发环境搭建

测吧(北京)科技有限公司

测试

@Lazy 注解为啥就能破解死循环?

江南一点雨

Java spring

XR应用云流化如何提升扩展现实体验?!

3DCAT实时渲染

实时渲染云 XR应用云流化

在 Amazon 上以高可用性模式实现 Microsoft SQL 数据库服务现代化的注意事项

亚马逊云科技 (Amazon Web Services)

Amazon

如何写出一手好代码(上篇-理论储备)?

慕枫技术笔记

后端 7月日更

基于Qt编写超精美自定义控件

芯动大师

RocketMQ 事务消息导致事务消息阻塞 BUG 排查

陈皮

RocketMQ bug 事务消息

成功实践丨虚实交互,安擎赋能城市交通大数据应用

科技热闻

百度智能云 X 软通动力:将结合大模型开发多领域智能应用

科技热闻

全加器

陈皮

关于新兴技术对我们生活和工作方式的改变 | 社区征文

fifoaa

年中技术盘点

百度与软通动力达成战略合作,共同探索大模型产业化落地

彭飞

AI大模型应用开发实战营第一周作业

panxiaochun

软件测试 | 编写第一个Java程序

测吧(北京)科技有限公司

测试

质效两全:媒体服务的创新“顶设”

阿里云CloudImagine

云计算 视频云

软件测试 | 一个简单的Java范例

测吧(北京)科技有限公司

测试

浅谈大模型时代的后台技术发展|社区征文

后台技术汇

年中技术盘点

什么是大规模敏捷SAFe?SAFe大规模敏捷管理工具

顿顿顿

敏捷开发 safe 大规模敏捷 scrum工具

博睿数据获聘信通院DGA首批智库专家组

博睿数据

可观测性 智能运维 博睿数据 信通院 专家智库

Infinity:视觉自回归生成新路线|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章