50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

阿里云开源视频生成大模型 I2VGen-XL,2 分钟生成高清电影级效果视频

  • 2023-09-06
    北京
  • 本文字数:749 字

    阅读完需:约 2 分钟

大小:434.29K时长:02:28
阿里云开源视频生成大模型I2VGen-XL,2分钟生成高清电影级效果视频

近日,阿里云推出全新视频生成大模型 I2VGen-XL,并在魔搭社区开放体验,用户上传一张图片后 2 分钟左右即可生成一段 1280*720 的高分辨率视频。据介绍,该模型的训练还使用了多种风格的视频数据,可生成科技感、电影色、卡通风格和素描等类型丰富的视频。目前,I2VGen-XL 的模型和代码均已开源。

 

在此之前,阿里云曾推出 AI 绘画创作大模型通义万相(基座模型 Composer)和可控视频生成模型 VideoComposer,团队在该领域发表 60 多篇 CCF-A 类论文,并在国际顶级视觉竞赛中获得 10 余项冠军。

 

和 AI 绘画创作大模型相比,视频生成大模型的技术门槛更高,其需要克服文本和视频内容匹配度、视频画面质量、画面连续性等诸多技术挑战。在此之前,阿里云和微软等科技公司相继推出一系列可控视频生成研究成果,例如用户可通过定义空间布局、运动模式等条件来生成视频,但其画面清晰度难以满足真实场景应用的需求。

 

针对该问题,阿里云进一步提出创新思路,I2VGen-XL 模型设计了两个阶段:首先在低分辨率条件下保证生成结果和给定图像语义的匹配度,随后通过视频扩散模型(VLDM)来提高视频分辨率,并同时提升时间和空间上的一致性,保证最终视频内容的清晰度和连贯性,最终实现 1280*720 高分辨率的突破,并且在画面细节的展现上大幅领先现有模型。

 

I2VGen-XL 模型研发负责人表示,未来将进一步实现 2K 超清效果,可应用于短视频内容生产、电影制作等场景。


I2VGen-XL流程图

 

目前,I2VGen-XL 模型已吸引国内外用户和开发者的广泛体验和二次开发,涌现了大量创意 AI 视频生成内容,例如在城堡上展翅的恐龙、宇航员在飞船中行走的科幻电影画面等等……知名 AI 社交媒体分析师 Ahsen Khaliq 在推特发布多条由该模型生成的视频效果,并表示模型在清晰度、纹理、语义和时间连续性方面有优势。



模型体验地址:

https://modelscope.cn/studios/damo/I2VGen-XL-Demo/summary

2023-09-06 11:279236

评论

发布
暂无评论
发现更多内容

Apache Calcite SQL Parser 原理剖析

端小强

Calcite

Final Cut Pro X 插件不能使用出现叹号的解决办法

Rose

积分超市系统(源码 + 文档 + 部署 + 讲解)

深圳亥时科技

让你的 Mac 用上最美的屏保,Aerial 使用教程

Rose

Flink 实时湖仓,为汽车行业数字化加速!

阿里云大数据AI技术

大数据 flink 车联网 实时计算

笔记 20240530

Geek_d01095

RocketMQ

鸿蒙新世界亮点聚焦:华为阅读APP升级精品书探索阅读新潮流

最新动态

Redis对象共享池,性能优化小细节

江南一点雨

如何检查Mac上是否启用了SIP系统完整性保护

Rose

pr lut插件如何安装? lut预设导入Premiere Pro教程分享

Rose

Mac怎么创建txt文件?如何设置新建txt的快捷键?

Rose

50亿美元亏损背后:解析生成式 AI 的商业模式之争

Baihai IDP

程序员 AI 白海科技 LLMs GenAI

鸿蒙新世界迎华为阅读重大升级:让电子书也能读出纸书沉浸感

最新动态

合合信息:生成式Al时代的内容安全与系统构建加速,开启智能文档的全新潜能

阿Q说代码

内容安全 智能文档

听听蜻蜓FM鸿蒙开发者的调频“新”声

最新动态

大模型RAG:基于大模型的机器人技术方案

程序员架构进阶

大模型 智能机器人 架构- 10月月更

photoshop弹出Time to update 提示框,如何关闭

Rose

Mac桌面多窗口整理神器Moom,Moom使用教程

Rose

淘宝1688跨境电商API接口接入指南:跨境卖家必备知识

代码忍者

pinduoduo API

第一届中国研究生操作系统开源创新大赛总决赛在长沙圆满落幕

最新动态

在鸿蒙,轻松敲出热爱

最新动态

PIRF 413:Recipe – What are we making?

Echo!!!

English

英特尔CEO帕特·基辛格:共筑x86核心架构,推动AI PC创新

E科讯

Lightroom Classic(Lrc)与Lightroom(Lr)有哪些区别?如何选择LRC和Lr?

Rose

使用Creative Cloud Cleaner Tool mac轻松彻底卸载删除Adobe系列软件

Rose

笔记 20240524

Geek_d01095

camunda

阿里云开源视频生成大模型I2VGen-XL,2分钟生成高清电影级效果视频_阿里巴巴_凌敏_InfoQ精选文章