写点什么

阿里云开源视频生成大模型 I2VGen-XL,2 分钟生成高清电影级效果视频

  • 2023-09-06
    北京
  • 本文字数:749 字

    阅读完需:约 2 分钟

大小:434.29K时长:02:28
阿里云开源视频生成大模型I2VGen-XL,2分钟生成高清电影级效果视频

近日,阿里云推出全新视频生成大模型 I2VGen-XL,并在魔搭社区开放体验,用户上传一张图片后 2 分钟左右即可生成一段 1280*720 的高分辨率视频。据介绍,该模型的训练还使用了多种风格的视频数据,可生成科技感、电影色、卡通风格和素描等类型丰富的视频。目前,I2VGen-XL 的模型和代码均已开源。

 

在此之前,阿里云曾推出 AI 绘画创作大模型通义万相(基座模型 Composer)和可控视频生成模型 VideoComposer,团队在该领域发表 60 多篇 CCF-A 类论文,并在国际顶级视觉竞赛中获得 10 余项冠军。

 

和 AI 绘画创作大模型相比,视频生成大模型的技术门槛更高,其需要克服文本和视频内容匹配度、视频画面质量、画面连续性等诸多技术挑战。在此之前,阿里云和微软等科技公司相继推出一系列可控视频生成研究成果,例如用户可通过定义空间布局、运动模式等条件来生成视频,但其画面清晰度难以满足真实场景应用的需求。

 

针对该问题,阿里云进一步提出创新思路,I2VGen-XL 模型设计了两个阶段:首先在低分辨率条件下保证生成结果和给定图像语义的匹配度,随后通过视频扩散模型(VLDM)来提高视频分辨率,并同时提升时间和空间上的一致性,保证最终视频内容的清晰度和连贯性,最终实现 1280*720 高分辨率的突破,并且在画面细节的展现上大幅领先现有模型。

 

I2VGen-XL 模型研发负责人表示,未来将进一步实现 2K 超清效果,可应用于短视频内容生产、电影制作等场景。


I2VGen-XL流程图

 

目前,I2VGen-XL 模型已吸引国内外用户和开发者的广泛体验和二次开发,涌现了大量创意 AI 视频生成内容,例如在城堡上展翅的恐龙、宇航员在飞船中行走的科幻电影画面等等……知名 AI 社交媒体分析师 Ahsen Khaliq 在推特发布多条由该模型生成的视频效果,并表示模型在清晰度、纹理、语义和时间连续性方面有优势。



模型体验地址:

https://modelscope.cn/studios/damo/I2VGen-XL-Demo/summary

2023-09-06 11:279030

评论

发布
暂无评论
发现更多内容

人形机器人,距离“转正上岗”还差几步?

趣解商业

科技 人形机器人 优必选

Gather在全球隐私保护领域的先锋地位

股市老人

从 Elasticsearch 到 Easysearch:国产搜索型数据库的崛起与未来展望

极限实验室

elasticsearch 数据库· easysearch 搜索型数据库

浅谈传统物理集中式的数据中台架构在数据开发中的不足

Aloudata

数据开发 ETL 数据集成 Data Fabric

突破传统看车局限,3DCAT实时云渲染为东风日产奇骏赋能

3DCAT实时渲染

实时渲染 云3D渲染 云VR看车 虚拟云车展

打造全新AI创作、分享神器!橙篇APP上线,让更多人「自由创作、自在分享」

科技热闻

PIRF-406-No Man is An Island…

Echo!!!

English

动作冒险游戏推荐:泰拉瑞亚Terraria(Win&Mac)中文版

你的猪会飞吗

Mac游戏推荐 单机游戏

基于STM32设计的简易手机

DS小龙哥

8月月更

深度剖析京东JD商品详情API返回值结构:解锁商品数据的新维度

代码忍者

API 接口 API 测试

倒计时8天!松下信息和望繁信科技邀您参加「数智时代下大数据应用的“道”与“术”」闭门会议

望繁信科技

大数据 数字化转型 流程挖掘 流程智能 智能化应用

系统试运行方案+试运行报告(Word原件)

金陵老街

需求文档 软件文档 软件资料 试运行文档

【PPT】低代码浪潮之下,带你走进TinyEngine

OpenTiny社区

前端 开源项目 OpenTiny TinyEngine 低代码引擎

如何在Python中使用情感分析API

幂简集成

Python API

OpenTelemetry:新一代的开源可观测性标准

乘云数字DataBuff

开源 #OpenTelemetry

博世(BOSCH)× Milvus:智能驾驶领域的数据挖掘革新

Zilliz

人工智能 大数据 AI 向量数据库 rag

阿里云开源视频生成大模型I2VGen-XL,2分钟生成高清电影级效果视频_阿里巴巴_凌敏_InfoQ精选文章