写点什么

阿里云开源视频生成大模型 I2VGen-XL,2 分钟生成高清电影级效果视频

  • 2023-09-06
    北京
  • 本文字数:749 字

    阅读完需:约 2 分钟

大小:434.29K时长:02:28
阿里云开源视频生成大模型I2VGen-XL,2分钟生成高清电影级效果视频

近日,阿里云推出全新视频生成大模型 I2VGen-XL,并在魔搭社区开放体验,用户上传一张图片后 2 分钟左右即可生成一段 1280*720 的高分辨率视频。据介绍,该模型的训练还使用了多种风格的视频数据,可生成科技感、电影色、卡通风格和素描等类型丰富的视频。目前,I2VGen-XL 的模型和代码均已开源。

 

在此之前,阿里云曾推出 AI 绘画创作大模型通义万相(基座模型 Composer)和可控视频生成模型 VideoComposer,团队在该领域发表 60 多篇 CCF-A 类论文,并在国际顶级视觉竞赛中获得 10 余项冠军。

 

和 AI 绘画创作大模型相比,视频生成大模型的技术门槛更高,其需要克服文本和视频内容匹配度、视频画面质量、画面连续性等诸多技术挑战。在此之前,阿里云和微软等科技公司相继推出一系列可控视频生成研究成果,例如用户可通过定义空间布局、运动模式等条件来生成视频,但其画面清晰度难以满足真实场景应用的需求。

 

针对该问题,阿里云进一步提出创新思路,I2VGen-XL 模型设计了两个阶段:首先在低分辨率条件下保证生成结果和给定图像语义的匹配度,随后通过视频扩散模型(VLDM)来提高视频分辨率,并同时提升时间和空间上的一致性,保证最终视频内容的清晰度和连贯性,最终实现 1280*720 高分辨率的突破,并且在画面细节的展现上大幅领先现有模型。

 

I2VGen-XL 模型研发负责人表示,未来将进一步实现 2K 超清效果,可应用于短视频内容生产、电影制作等场景。


I2VGen-XL流程图

 

目前,I2VGen-XL 模型已吸引国内外用户和开发者的广泛体验和二次开发,涌现了大量创意 AI 视频生成内容,例如在城堡上展翅的恐龙、宇航员在飞船中行走的科幻电影画面等等……知名 AI 社交媒体分析师 Ahsen Khaliq 在推特发布多条由该模型生成的视频效果,并表示模型在清晰度、纹理、语义和时间连续性方面有优势。



模型体验地址:

https://modelscope.cn/studios/damo/I2VGen-XL-Demo/summary

2023-09-06 11:279534

评论

发布
暂无评论
发现更多内容

需求是被挖掘还是被创造出来的?

Neco.W

产品 互联网 需求

猿灯塔-Phaser 使用介绍

猿灯塔

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (六)测试哪些内容:Right-BICEP

编程道与术

Java 编程 软件测试 TDD 单元测试

一文读懂阿里云通信的产品体系、技术架构与智能化应用场景实践

阿里云Edge Plus

人工智能 云通信 短信 语音 智能联络中心

ThreadLocal到底会不会内存泄漏?实战直接告诉你答案!

刘超

Java 多线程 ThreadLocal

一杯茶的时间,上手 React 框架开发

图雀社区

Reac

油管博主路透 3080Ti 参数、黄教主烤箱中拿出 DGX A100 预热发布会

神经星星

人工智能 互联网巨头 gpu 互联网 英伟达

如何快速更改qcow2镜像文件

奔跑的菜鸟

云计算

全面解读信创行业 关注国产操作系统

统小信uos

操作系统

我为什么要开启InfoQ写作

Nick

故障的传播方式与隔离办法

Wales Kuo

全球经济动荡下,超流币逆袭而来!

极客编

谈谈控制感(3):让孩子更好地成长

史方远

心理学 控制感 教育

选择适合自己的 OLAP 引擎

程序员小陶

大数据 开源 OLAP

ZigBee3.0 节点入网流程分析

taox

网络协议

物联网技术栈之网关技术

老任物联网杂谈

物联网网关

Tomcat安全配置

wong

Tomccat security

游戏夜读 | 关卡设计为什么难?

game1night

初探Electron,从入门到实践

葡萄城技术团队

大前端 Electron SpreadJS

定在下午面试的那位候选人,说他不来了

Geek_6rptuk

团队管理 面试 简历优化 招聘

终于有一款组件可以全面超越Apache POI

葡萄城技术团队

前后端分离 服务端 GrapeCity Documents

Flink Weekly | 每周社区动态更新

Apache Flink

大数据 flink 流计算 实时计算

什么是工作

史方远

随想 工作

怀念小时候吗?

安静的下雪天

个人感想

前浪的经验:区块链软件,一定也要去中心化

WasmEdge

比特币 区块链 智能合约 以太坊 加密货币

AtomicStampedReference是怎样解决CAS的ABA问题

捉虫大师

Java

回顾经典,Netflix的推荐系统架构

王喆

人工智能 学习 推荐系统 netflix

线程通信知识点扫盲!

Simon郎

Java 后端 多线程

由纪念日想到杨德昌

Elizen

随笔 电影

Android10版本引发的生产故障及安全知识归纳

大刘

android https TLS 加解密

高仿瑞幸小程序 08 创建第一个云函数

曾伟@喵先森

小程序 微信小程序 大前端 移动

阿里云开源视频生成大模型I2VGen-XL,2分钟生成高清电影级效果视频_阿里巴巴_凌敏_InfoQ精选文章