2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

媲美 Sora?Runaway 亮相视频生成模型 Gen-3 Alpha,更懂物理世界

  • 2024-06-18
    北京
  • 本文字数:1455 字

    阅读完需:约 5 分钟

大小:712.17K时长:04:03
媲美Sora?Runaway亮相视频生成模型Gen-3 Alpha,更懂物理世界

人工智能生成的高质量视频的竞争正在升温。

 

当地时间 6 月 17 日,专门为电影和图像内容创作者开发生成式人工智能工具的公司 Runway AI 发布了 Gen-3 Alpha。

 

Gen-3 Alpha 地址:https://runwayml.com/blog/introducing-gen-3-alpha/

 

该公司最新的人工智能模型可以根据文本描述和静态图像生成视频片段。Runway 公司表示,与 Runway 之前的旗舰视频模型 Gen-2 相比,该模型在生成速度和保真度方面实现了“重大”改进,并且对其所创建视频的结构、风格和动作进行了精细控制。

 

Gen-3 将在未来几天内向 Runway 订阅者推出,包括企业客户和 Runway 创意合作伙伴计划中的创作者。

 

Runway 在其博客上写道:“Gen-3 Alpha 擅长生成具有各种动作、手势和情绪的富有表现力的人类角色。它旨在诠释各种风格和电影术语,并实现富有想象力的过渡和场景中元素的精确关键帧。”

 

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    提示:从窗户向外看,看到一个巨大的奇怪生物在夜晚破败的城市中行走,一盏路灯昏暗地照亮了整个区域。


    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      提示:一张电影广角肖像,一个男人的脸被电视的光照亮。


      00:00 / 00:00
        1.0x
        • 3.0x
        • 2.5x
        • 2.0x
        • 1.5x
        • 1.25x
        • 1.0x
        • 0.75x
        • 0.5x
        网页全屏
        全屏
        00:00


        提示:一个中年悲伤的秃头男人突然变得快乐,因为一顶卷发假发和一副太阳镜突然落在他的头上。


        目前 Gen-3 还未开放给公众试用,但在官网的博客中,Runway 秀出了数十个精彩的生成视频,无论是光线、色彩、运动轨迹、人物细节都非常逼真,有行业人士表示一些视频是 Sora 级别的质量。

         

        Runway 表示,Gen-3 Alpha 是即将推出的一系列模型中的首个,这一系列模型是在为大规模多模态训练而构建的新基础设施上训练的。

         

        Gen-3 Alpha 有其局限性,其中局限之一就是其视频最长只能拍摄 10 秒。不过,Runway 联合创始人 Anastasis Germanidis 承诺,Gen-3 只是下一代模型系列中第一个也是最小的一个视频生成模型,这些模型都是在升级的基础设施上进行训练的。

         

        Germanidis 今早接受 TechCrunch 采访时表示:“该模型在处理复杂的角色和物体交互时可能会遇到困难,而且生成过程并不总是严格遵循物理定律。首次推出的版本将支持 5 秒和 10 秒的高分辨率生成,生成时间明显快于 Gen-2。生成一段 5 秒的视频需要 45 秒,生成一段 10 秒的视频则需要 90 秒。”

         

        与所有视频生成模型一样,Gen-3 Alpha 也接受了大量视频和图像样本的训练,因此它可以“学习”这些样本中的模式来生成新的视频片段。训练数据从何而来?Runway 没有透露。

         

        如今,很少有生成式 AI 供应商主动提供此类信息,部分原因是他们认为训练数据是一种竞争优势,因此对训练数据和相关信息讳莫如深。

         

        团队创始成员之一的 Germanidis 表示:“我们有一个内部研究团队,负责监督我们所有的培训,我们使用精选的内部数据集来训练我们的模型。”他没有再说什么。

         

        Runway 由克里斯托瓦尔(Cristóbal Valenzuela),亚历杭德罗(Alejandro Matamala)和阿纳斯塔西斯(Anastasis Germanidis)三个智利人于 2018 年底创立,由他们在纽约大学(NYU)的论文项目发展而来,他们在此相识并获得了研究生学位。

         

        Runway 在 2018 年获得了 Lux Capital 的 200 万美元种子融资,在 2020-2022 年陆续完成了 A、B、C 三轮融资,C 轮由 Felicis 领投,金额达 5000 万美元,估值 5 亿美元。2024 年 6 月 1 日,The Information 消息,生成式 AI 平台 Runway 获得 1 亿美元 D 轮融资(约 7 亿元),估值 15 亿美元,本次由谷歌领投。

         

        此外,Runway 还运营着 Runway Studios,这是一个娱乐部门,作为企业客户的制作合作伙伴,并主办人工智能电影节,这是首批专门展示完全或部分由人工智能制作的电影的活动之一。

         

        Runway 的主要使用人群包括电影制作人、设计师、VFX 和 CGI 专业人士、艺术家、编码员、音乐家、学生和教育工作者等。

        2024-06-18 18:419347
        用户头像
        李冬梅 加V:busulishang4668

        发布了 1194 篇内容, 共 819.4 次阅读, 收获喜欢 1307 次。

        关注

        评论

        发布
        暂无评论
        发现更多内容

        京东承办“创客北京2022” 京东科技参与并推出三大服务举措

        京东科技开发者

        数字化转型 供应链 企业服务 中小企业

        兆骑科创创新人才引进,高端人才引进,项目落地引进

        兆骑科创凤阁

        秒杀架构分析与实践

        Bruce Duan

        签约计划第三季

        融云 | 云办公时代,企业通讯录的技术选型

        融云 RongCloud

        企业 云办公

        Java面向对象之继承

        楠羽

        【8.5-8.12】写作社区精彩技术博文回顾

        InfoQ写作社区官方

        优质创作周报

        一文了解如何托管SVN储存库,以及版本控制的更佳选择

        龙智—DevSecOps解决方案

        svn 版本控制 版本管理 版本控制系统

        Canvas 低代码拖拽建模,支持离线任务|ModelWhale 版本更新

        ModelWhale

        数据分析 Jupyter Notebook 课程 离线部署 低代码报告

        【分布式集群】微服务电商应用系统的集群构建

        嚯嚯嚯www

        Linux

        Neo4j导入思知OwnThink开源的知识图谱

        Joshua

        nlp neo4j 知识图谱

        语音直播app——满足不同行业的业务需求

        开源直播系统源码

        软件开发 直播系统源码 语音直播系统 语音直播app

        Spring Cache设计之美,你品,你细品...

        华为云开发者联盟

        后端 开发

        MySQL 原理与优化:原数据锁的应用

        老崔说架构

        机器学习/评分卡常用指标及计算

        Joshua

        机器学习 AI 信息熵 评分卡

        一块GPU训练TB级推荐模型不是梦,OneEmbedding性能一骑绝尘

        OneFlow

        深度学习 gpu 模型

        软件交付周期缩短!且看精益思想如何加速全局价值流动

        嘉为蓝鲸

        DevOps 敏捷 精益

        什么是网络即服务 (NaaS)?

        wljslmz

        网络技术 8月月更 NaaS 网络即服务

        涛思数据加入龙蜥社区,携手共建时序数据库生态

        OpenAnolis小助手

        数据库 涛思数据 开源 龙蜥社区 CLA

        开源一夏 | Spring MVC深度学习

        叶秋学长

        开源 Spring MVC 8月月更

        一文读懂工业设备预测性维护的概念与实现

        PreMaint

        企业设备管理 预测性维护 设备健康管理 状态检测 振动监测

        不要让CMDB沦为数据孤岛!运维高质量CMDB“修炼”之道

        嘉为蓝鲸

        运维 数据 配置 CMDB 配置管理

        室内led大屏幕可以用在室外吗?​

        Dylan

        LED显示屏 户外LED显示屏 户内led显示屏

        2022不容错过的50个“低代码”发展现状、趋势与数据统计

        优秀

        低代码 无代码

        你要的 Helm Chart 应用金丝雀发布终于来了!

        阿里巴巴云原生

        阿里云 开源 云原生 KubeVela

        熬夜肝了这一份C++开发详细学习路线

        C++后台开发

        后台开发 C/C++ 后端开发 C++后台开发 C++开发

        快速实现 CDN 直播

        ZEGO即构

        CDN 直播 音视频开发

        【LeetCode】用户分组Java题解

        Albert

        LeetCode 8月月更

        CI与开源代码安全篇 | 龙智邀您共赴GOPS全球运维大会,探索大规模、敏捷、安全、开放式的软件研发与运营之路

        龙智—DevSecOps解决方案

        GOPS大会 运维‘

        CI/CD | 使用静态代码分析工具,有效补充持续集成

        龙智—DevSecOps解决方案

        cicd 持续集成 CI/CD

        兆骑科创双创服务平台,招商引资、招企引税、招才引智

        兆骑科创凤阁

        历时4个月,4大板块,328页52188字,SpringMVC源码解析文档

        冉然学Java

        Java spring Spring MVC 构架 Spring Web MVC、

        媲美Sora?Runaway亮相视频生成模型Gen-3 Alpha,更懂物理世界_生成式 AI_李冬梅_InfoQ精选文章