免费注册!6月19-20日,「亚马逊云科技中国峰会」重磅来袭! 了解详情
写点什么

Runway 全新 Gen-3 视频生成模型获网友盛赞:比 Sora 更好

  • 2024-06-20
    北京
  • 本文字数:2192 字

    阅读完需:约 7 分钟

大小:1.04M时长:06:04
Runway 全新 Gen-3 视频生成模型获网友盛赞:比 Sora 更好

凭借广受欢迎的视频生成工具而声名大噪的 AI 厂商 Runway 最近发布了最新版本的 Runway Gen-3。Gen-3 Alpha 是 Runway 在专为大规模多模态训练所构建的全新基础设施之上,训练出的模型家族的首位成员。与 Gen-2 相比,Gen-3 在保真度、一致性和运动表现方面迎来重大改进,并朝着构建通用世界模型迈出了坚实一步。


新模型目前仍处于 alpha 内测阶段,尚未对外公布。但从一系列演示视频的效果来看,与目前已经开放的 Gen-2 相比,下代模型生成的视频似乎在连续性、真实性以及提示词遵循能力方面取得了重大飞跃。


  • 细粒度的时间控制


Gen-3 Alpha 由描述精细、时间密集的描述词训练而成,可实现富有想象力的过渡效果并为场景元素生成精确的关键帧。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    • 逼真的人类形象


    Gen-3 Alpha 擅长生成具有各种动作、手势及情绪,且富有表现力的人类形象,开拓出前所未有的叙事方式与空间。

    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      • 为艺术家而生,供艺术家使用


      Gen-3 Alpha 的训练由研究科学家、工程师及艺术家共同组成的跨学科团队倾力完成,旨在诠释各种视觉风格及镜头语言。


      00:00 / 00:00
        1.0x
        • 3.0x
        • 2.5x
        • 2.0x
        • 1.5x
        • 1.25x
        • 1.0x
        • 0.75x
        • 0.5x
        网页全屏
        全屏
        00:00


        Gen-3 模型生成的视频,特别是包含大画幅人脸特写的视频,拥有极为逼真的画面效果。这也不禁令 AI 艺术社区的成员们将其与 OpenAI 尚未发布,但同样备受期待的 Sora 进行了比较。


        00:00 / 00:00
          1.0x
          • 3.0x
          • 2.5x
          • 2.0x
          • 1.5x
          • 1.25x
          • 1.0x
          • 0.75x
          • 0.5x
          网页全屏
          全屏
          00:00


          网友评价


          一位 Reddit 用户在 Runway Gen-3 讨论主题下的高票评论中写道,“哪怕目前展示的都是精心挑选的优质之作,效果看起来也要比 Sora 好得多。Sora 的效果和观感仍有风格化痕迹,但这边的视频则更真实,也是我迄今为止见过的最好的 AI 生成视频。”


          另一位用户则在拥有 6.6 万成员的 Reddit AI Video 子频道上写道,“如果不告诉我,我肯定会觉得这些画面是真实拍摄出来的。”


          AI 电影制作人、自称 Runway 创意合作伙伴的用户 PZF 发布推文称,“这些 Runway Gen-3 片段在我看来吸引力十足——看起来很有电影的质感。画面流畅、平实(我是说非常自然)而且相当可信。”



          除了 Gen-3 视频生成器,Runway 还推出了一套微调工具,提供更灵活的图像与相机控制选项。该公司发布推文称,“Gen-3 Alpha 将为 Runway 的文本生视频、图像生视频以及文本生图像工具、现有控制模式(例如运动画笔、高级相机控制及导演模式)以及即将推出的工具提供支持,以前所未有的精细方式控制结构、风格与运动形态。”



          Gen-3 Alpha 是 Runway 在专为大规模多模态训练所构建的全新基础设施之上训练出的模型家族的首位成员,代表我们朝着构建通用世界模型迈出了坚实一步。



          Gen-3 Alpha 经过视频与图像的联合训练,旨在为 Runway 旗下各文本生视频、图像生视频及文本生图像工具、现有控制模式(如运动画笔、高级相机控制、导演模式)以及即将推出的更多工具提供支持,以前所未有的精细方式控制结构、风格与运动形态。


          Runway 宣称,Gen-3 是其实现建立“通用世界模型”这一雄心勃勃目标的重要一步。这些模型使得 AI 系统能够构建环境的内部表现,并借此来模拟该环境中将要发生的未来事件。这种方法使得 Runway 有别于只关注特定时间轴内下一可能帧的传统预测技术。


          虽然 Runway 方面尚未透露 Gen-3 的具体发布时间,但公司联合创始人兼 CTO Anastasis Germanidis 宣布 Gen-3 Alpha“将很快在 Runway 产品内现身”。他还透露,具体包括现有模态以及“一些目前只能借助更强大基础模型实现的新模态”。



          Runway Gen-3 Alpha 将很快在 Runway 产品中现身,并将支持大家所熟悉的全部现有模态(文本生视频、图像生视频、视频生视频),以及一些目前只能借助更强大基础模型实现的新模态。

          竞品对比


          Runway 的 AI 探索之旅始于 2021 年,当时他们与慕尼黑大学的研究人员合作开发出 Stable Diffusion 的首个版本。Stability AI 后来以帮助该项目承担计算成本为由介入,并推动 AI 视频生成在全球范围内掀起热潮。


          从那时起,Runway 就一直是 AI 视频生成领域的重要参与者,与 Pika Labs 等竞争对手并驾齐驱。然而,随着 OpenAI 宣布推出超越现有模型能力的 Sora,市场格局也随之发生变化。好莱坞著名演员阿什顿·库彻最近表示,像 Sora 这样的工具可能会彻底颠覆影视剧的创作逻辑,此言一出旋即引发轰动。


          然而就在全球翘首期待 Sora 发布之际,新的竞争对手也陆续崭露头角,包括快手打造的 Kling 以及 Luma AI 的 Dream Machine。


          Kling 是一款来自中国的视频生成器,能够以每秒 30 帧的速度生成最长 2 分钟的 1080p 分辨率视频,较现有模型实现了巨大改进。这套中文模型现已发布,但用户需要使用中国手机号进行注册。快手表示后续将为该模型推出全球版。


          另一颗新星 Dream Machine 则是一套可供免费使用的平台,能够将书面文本转换为动态视频,且生成结果在质量、连续性及提示词遵循效果方面全面超越 Runway Gen-2。用户只需提交 Google 账户即可完成登录,但目前由于人气过高,内容生成速度往往很慢、甚至无法顺利完成视频生成。


          在开源领域,Stable Video Diffusion 虽然在生成效果上不算出色,但其开放属性却为模型的后续改进和发展提供了坚实基础。Vidu 是由北京生数科技和清华大学开发的另一款 AI 视频生成器,采用名为 Universal Vision Transformer (U-ViT) 的专有视觉转换模型架构,只需一次单击即可生成 16 秒长的 1080p 分辨率视频。


          至于前面提到的 Pika Labs,由于尚未发布重大更新,所以其目前的生成效果基本与 Runway Gen-2 持平。


          参考链接:


          https://runwayml.com/blog/introducing-gen-3-alpha/https://decrypt.co/235842/runway-gen-3-ai-video-better-than-sora


          2024-06-20 18:049099

          评论

          发布
          暂无评论
          发现更多内容

          技术的交流 思想的碰撞|2023开放原子全球开源峰会TOC面对面分论坛即将启幕

          开放原子开源基金会

          开源 社区 TOC

          世界500强开滦集团的财务共享建设路径

          用友BIP

          财务共享

          鲲鹏DevKit助力深圳财富趋势高效开发行情分析系统,行情揭示快人一步

          说山水

          Java 高效处理千万级数据:技巧与最佳实践

          xfgg

          Java 大数据

          一文回顾 Boundless Hackathon at Stanford 首期 Workshop

          西柚子

          mac电脑如何远程控制win?微软远程桌面连接工具来帮你!

          Rose

          Mac远程控制软件 mac电脑如何远程控制win microsoft remote desktop 微软远程桌面连接工具

          Scrum敏捷项目管理真实案例

          顿顿顿

          Scrum 敏捷开发 敏捷开发管理 敏捷项目管理 scrum工具

          在软件定义汽车的时代,低代码究竟给车企数字化转型带来了什么?

          优秀

          低代码 车企 车企数字化

          鲲鹏DevKit助力南京信息工程大学高效开发

          说山水

          FC红白机游戏600合集 for mac(小霸王游戏) 单机离线版

          Rose

          Mac游戏下载 FC 红白机游戏 任天堂游戏下载 小霸王游戏

          对应用数据开发还有疑惑?看这篇就够了!数据存储、管理,通通掌握!

          HarmonyOS开发者

          HarmonyOS

          智能出行 驱动未来|2023开放原子全球开源峰会CARSMOS开源智能出行生态年会即将启幕

          开放原子开源基金会

          开源 智能出行 CARSMOS

          软件测试/测试开发丨接口测试学习笔记

          测试人

          程序员 软件测试 自动化测试 测试开发

          植物大战僵尸mac版下载

          Rose

          植物大战僵尸 mac 植物大战僵尸中文版 植物大战僵尸下载 mac塔防游戏

          提升您的 MQTT 云服务:深入探索 BYOC

          EMQ映云科技

          物联网 云服务 mqtt

          一文回顾 Boundless Hackathon at Stanford 首期 Workshop

          鳄鱼视界

          CodeWhisperer 初体验

          天黑黑

          AI 亚马逊云 CodeWhisperer

          abaqus有限元仿真常见问题(一):数值仿真在产品研发中的作用

          思茂信息

          CAE abaqus abaqus软件 abaqus有限元仿真

          华为教育中心:奇趣“童”行庆六一 多彩儿童应用助成长

          科技热闻

          led显示屏保养技巧

          Dylan

          故障 LED显示屏 设备日常保养

          秒验 iOS端集成指南

          MobTech袤博科技

          支持M1的苹果电脑视频下载器-Downie 4 Mac中文版

          Rose

          Mac 视频下载工具 Downie 4许可证 Downie 4中文版 Downie mac破解版

          如何在大学校园内合作运营共享电单车

          共享电单车厂家

          校内共享电单车 共享电动车投放 共享电单车合作 共享电单车厂家

          百度倾力出品|《神经网络机器翻译技术及产业应用》正式上线

          飞桨PaddlePaddle

          人工智能 深度学习 百度飞桨

          挖掘算力产业的创新力量和新型机遇|2023开放原子全球开源峰会先进计算分论坛即将启幕

          开放原子开源基金会

          开源 算力 先进计算

          乘云而上,山西软件行业CXO思享会在晋起航

          说山水

          开源创新 协同融合|2023开放原子全球开源峰会开源协作平台分论坛即将启幕

          开放原子开源基金会

          开源 开源协作

          解锁软件工程新角色——平台工程师

          SEAL安全

          DevOps 平台工程 平台工程师

          Runway 全新 Gen-3 视频生成模型获网友盛赞:比 Sora 更好_AI&大模型_褚杏娟_InfoQ精选文章