2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

Infinity:视觉自回归生成新路线|AICon 北京

  • 2025-05-28
    北京
  • 本文字数:1110 字

    阅读完需:约 4 分钟

大小:592.99K时长:03:22
Infinity:视觉自回归生成新路线|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


字节跳动 AIGC 算法工程师韩剑已确认出席并发表题为《Infinity:视觉自回归生成新路线》的主题分享,探讨以 ChatGPT、DeepSeek 为代表的大语言模型(LLM)取得了巨大的成功,掀起了全球新一轮 AI 浪潮,但是在视觉生成领域,目前主流的方法却是一直以扩散模型为主导。与大语言模型采取相同技术路线的视觉自回归方法因为具有更好的 scaling 特性,能够统一理解 &生成任务,隐藏着巨大的潜力,正受到人们越来越多的重视。本次演讲中,韩剑将以被选为 CVPR 2025 Oral 的工作 Infinity 为例,详细介绍自回归视觉生成的底层技术原理。并以图像生成和视频生成两个具体场景,分享最新的研究成果和相关思考。



韩剑,硕士毕业于清华大学电子系,现就职于字节跳动商业化技术团队,该团队在视觉生成领域先后推出了 VAR、LllamaGen、Infinity、Goku 等多项重要研究成果。韩剑的主要研究方向为图像生成和视频生成,在自回归图像生成和视频生成领域积累了丰富的经验,其最新研究成果 Infinity 被选中在 CVPR 2025 上做口头报告。他在本次会议的详细演讲内容如下:


演讲提纲

1. 自回归模型和 Scaling Law

2. 视觉自回归 v.s. 扩散模型

3. Infinity:视觉自回归生成新路线

  • 离散 Visual Tokenizer

  • Bitwise AutoRegressive Modeling

  • 图像生成实践

  • 视频生成实践

4. 分析和思考


您认为,这样的技术在实践过程中有哪些痛点?目前看以 Infinity 为代表的视觉自回归模型在视频生成任务上相比 SOTA 的扩散模型生成速度具有明显优势,但是效果上还有一些差距。


您的演讲有哪些前沿亮点?这是一个非常详尽的视觉自回归技术分享,通过这次分享,读者可以深入了解到视觉自回归的底层技术实现、目前达到的效果水位,以及未来可能的研究方向。


听众收益

  • 视觉自回归的技术原理、实现方法、目前达到的生成效果

  • 视觉自回归技术的优缺点以及未来的发展方向

  • 如何基于视觉自回归构建图像/视频生成模型


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-05-28 14:003509

评论

发布
暂无评论

《代码整洁之道》-大师眼中的整洁代码是什么样

京东科技开发者

软件测试学习笔记丨Postman基础使用

测试人

软件测试 Postman

华为应用市场:用户为首,技术领先,筑牢应用安全“第一道防线”

最新动态

ICE 8月各项板块盈利报告,人工智能与高频交易驱动稳定收益

科技热闻

由点到面,英特尔与腾讯持续深耕云、网络、存储等领域

E科讯

大奖收割机!望繁信科技荣获年度技术创新和应用品牌奖

望繁信科技

数字化转型 流程挖掘 流程资产 流程智能

精准学:用一根垂直大模型支柱,撑起教育普惠的未来

脑极体

AI

《代码整洁之道》-大师眼中的整洁代码是什么样

京东零售技术

后端 代码

京东鸿蒙上线前瞻——使用 Taro 打造高性能原生应用

京东零售技术

鸿蒙

精准电商营销:基于京东商品详情API返回值的数据分析

技术冰糖葫芦

api 网关 API Gateway API 测试 API 策略 pinduoduo API

《从零构建Rust生产级服务》中文版出版!!!

简单

rust语言

加密货币市场持有与价格波动:CFI调查揭示的趋势与未来展望

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 NFT开发 代币开发

构建Web3社交平台:DeBox式DApp开发全攻略

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 NFT开发 代币开发

Reflection 70B 遭质疑基模为 Llama 3;Replit Agent:编程 0 基础适用丨 RTE 开发者日报

声网

卓越笔触:打造高质量文章的艺术与科学

京东科技开发者

京东商品评论数据接口:洞察消费者心声的重要渠道

tbapi

京东API接口 京东商品评论接口

三分钟带你看懂,低代码开发赋能办公方式转变

不在线第一只蜗牛

低代码

收藏!打造高质量技术文章的8个技巧

京东零售技术

写作 企业号9月PK榜

等待风起——京东.Vision项目参与实录分享

京东零售技术

Vision pro 京东.vision

京东.Vision —— 空间计算时代的用户购物之旅

京东科技开发者

别让代码愁白头发!15 个 Python 函数拯救你的开发生活

不在线第一只蜗牛

Java Python

驾驭复杂市场,商品计划软件:企业制胜的智囊团

第七在线

海外云手机有哪些推荐?

Ogcloud

云手机 海外云手机 云手机推荐 手机群控 ogphone云手机

从管控角度谈慢SQL治理

不思jo

阿里巴巴中国站商品搜索API返回值解析与实战

技术冰糖葫芦

api 网关 API Gateway API 测试 API 策略 pinduoduo API

数据库上云有多轻松?华为云技术专家带你玩转云数据库API

华为云开发者联盟

如何使用 StarRocks 管理和优化数据湖中的数据?

镜舟科技

数据湖 数据处理 分布式架构 StarRocks

Infinity:视觉自回归生成新路线|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章