写点什么

媲美 Sora?Runaway 亮相视频生成模型 Gen-3 Alpha,更懂物理世界

  • 2024-06-18
    北京
  • 本文字数:1455 字

    阅读完需:约 5 分钟

大小:712.17K时长:04:03
媲美Sora?Runaway亮相视频生成模型Gen-3 Alpha,更懂物理世界

人工智能生成的高质量视频的竞争正在升温。

 

当地时间 6 月 17 日,专门为电影和图像内容创作者开发生成式人工智能工具的公司 Runway AI 发布了 Gen-3 Alpha。

 

Gen-3 Alpha 地址:https://runwayml.com/blog/introducing-gen-3-alpha/

 

该公司最新的人工智能模型可以根据文本描述和静态图像生成视频片段。Runway 公司表示,与 Runway 之前的旗舰视频模型 Gen-2 相比,该模型在生成速度和保真度方面实现了“重大”改进,并且对其所创建视频的结构、风格和动作进行了精细控制。

 

Gen-3 将在未来几天内向 Runway 订阅者推出,包括企业客户和 Runway 创意合作伙伴计划中的创作者。

 

Runway 在其博客上写道:“Gen-3 Alpha 擅长生成具有各种动作、手势和情绪的富有表现力的人类角色。它旨在诠释各种风格和电影术语,并实现富有想象力的过渡和场景中元素的精确关键帧。”

 

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    提示:从窗户向外看,看到一个巨大的奇怪生物在夜晚破败的城市中行走,一盏路灯昏暗地照亮了整个区域。


    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      提示:一张电影广角肖像,一个男人的脸被电视的光照亮。


      00:00 / 00:00
        1.0x
        • 3.0x
        • 2.5x
        • 2.0x
        • 1.5x
        • 1.25x
        • 1.0x
        • 0.75x
        • 0.5x
        网页全屏
        全屏
        00:00


        提示:一个中年悲伤的秃头男人突然变得快乐,因为一顶卷发假发和一副太阳镜突然落在他的头上。


        目前 Gen-3 还未开放给公众试用,但在官网的博客中,Runway 秀出了数十个精彩的生成视频,无论是光线、色彩、运动轨迹、人物细节都非常逼真,有行业人士表示一些视频是 Sora 级别的质量。

         

        Runway 表示,Gen-3 Alpha 是即将推出的一系列模型中的首个,这一系列模型是在为大规模多模态训练而构建的新基础设施上训练的。

         

        Gen-3 Alpha 有其局限性,其中局限之一就是其视频最长只能拍摄 10 秒。不过,Runway 联合创始人 Anastasis Germanidis 承诺,Gen-3 只是下一代模型系列中第一个也是最小的一个视频生成模型,这些模型都是在升级的基础设施上进行训练的。

         

        Germanidis 今早接受 TechCrunch 采访时表示:“该模型在处理复杂的角色和物体交互时可能会遇到困难,而且生成过程并不总是严格遵循物理定律。首次推出的版本将支持 5 秒和 10 秒的高分辨率生成,生成时间明显快于 Gen-2。生成一段 5 秒的视频需要 45 秒,生成一段 10 秒的视频则需要 90 秒。”

         

        与所有视频生成模型一样,Gen-3 Alpha 也接受了大量视频和图像样本的训练,因此它可以“学习”这些样本中的模式来生成新的视频片段。训练数据从何而来?Runway 没有透露。

         

        如今,很少有生成式 AI 供应商主动提供此类信息,部分原因是他们认为训练数据是一种竞争优势,因此对训练数据和相关信息讳莫如深。

         

        团队创始成员之一的 Germanidis 表示:“我们有一个内部研究团队,负责监督我们所有的培训,我们使用精选的内部数据集来训练我们的模型。”他没有再说什么。

         

        Runway 由克里斯托瓦尔(Cristóbal Valenzuela),亚历杭德罗(Alejandro Matamala)和阿纳斯塔西斯(Anastasis Germanidis)三个智利人于 2018 年底创立,由他们在纽约大学(NYU)的论文项目发展而来,他们在此相识并获得了研究生学位。

         

        Runway 在 2018 年获得了 Lux Capital 的 200 万美元种子融资,在 2020-2022 年陆续完成了 A、B、C 三轮融资,C 轮由 Felicis 领投,金额达 5000 万美元,估值 5 亿美元。2024 年 6 月 1 日,The Information 消息,生成式 AI 平台 Runway 获得 1 亿美元 D 轮融资(约 7 亿元),估值 15 亿美元,本次由谷歌领投。

         

        此外,Runway 还运营着 Runway Studios,这是一个娱乐部门,作为企业客户的制作合作伙伴,并主办人工智能电影节,这是首批专门展示完全或部分由人工智能制作的电影的活动之一。

         

        Runway 的主要使用人群包括电影制作人、设计师、VFX 和 CGI 专业人士、艺术家、编码员、音乐家、学生和教育工作者等。

        2024-06-18 18:418918
        用户头像
        李冬梅 加V:busulishang4668

        发布了 1108 篇内容, 共 719.3 次阅读, 收获喜欢 1253 次。

        关注

        评论

        发布
        暂无评论
        发现更多内容

        马蹄链DAPP代币合约流动性挖矿分红系统开发详细及方案

        区块链软件开发推广运营

        交易所开发 dapp开发 链游开发 公链开发 代币开发

        企业办公即时通讯软件BeeWorks,私有化安全防泄密

        BeeWorks

        IM 即时通讯IM 私有化部署 企业级应用

        生成式 AI 引爆广告效率革命,揭秘京东大模型应用架构的实践之道

        京东零售技术

        业内首次! 全面复现DeepSeek-R1-Zero 数学、代码能力,训练步数仅需R1-Zero 1/10

        快手技术

        LLM

        深入研究:Shopee商品详情API接口详解

        tbapi

        Shopee shopee API shopee商品详情接口

        代币经济学赋能社区自运营:构建Web3时代的永动飞轮

        区块链软件开发推广运营

        dapp 交易所开发 链游开发 公链开发 代币开发

        新加坡见!快手11篇论文入选人工智能领域顶会ICLR 2025

        快手技术

        人工智能 Iclr

        Java 开发玩转 MCP:从 Claude 自动化到 Spring AI Alibaba 生态整合

        阿里巴巴云原生

        阿里云 云原生 MCP

        Markdown 所见即所得(WYSIWYG)编辑器的研究

        yuanyxh

        前端 Typora Markdown 编辑器

        什么是公链?公链项目有哪些?公链项目开发

        区块链软件开发推广运营

        交易所开发 dapp开发 链游开发 公链开发 代币开发

        埋点系统技术选型-自研还是开源?

        ClkLog

        开源 数据分析 埋点 用户行为分析 客户画像

        从 “码农” 到 “架构师”:AI 工具如何助力职业跃迁?

        飞算JavaAI开发助手

        高防IP是如何防护DDoS攻击和CC攻击的

        网络安全服务

        IP 带宽 高防服务器 高防IP DDoS 攻击

        动态更新技术重构中国互联网:前端热更新的效率革命与生态演进

        xuyinyin

        意图框架事件推荐方案,精准匹配用户需求

        HarmonyOS SDK

        harmoyos

        赋能车联网 | 智能地铁物联系统,让出行更顺畅

        KaiwuDB

        数据库 赋能 kwdb

        与智者同行:京东零售技术人的成长书单

        京东零售技术

        捷途纵横G700品鉴会:潮改共创,解锁豪华越野的无限可能

        科技热闻

        企业AI成功落地的关键:生产级AI应用背后的“脏活累活”

        UniverAI智宇苍穹

        开发平台 企业 AI 应用 AI落地 AI 大模型 企业级AI工程化

        企业为什么要用私有化的视频会议软件?BeeWorks Meet支持私有化

        BeeWorks

        即时通讯 IM 私有化部署 企业级应用

        吼吼科技:在智能制造领域的合作与创新之路

        极客天地

        打破"沙漏“现象→提高生成式搜索/推荐的上限

        京东零售技术

        浅析金仓数据库KingbaseES的Query Mapping:无需改代码的 SQL 优化神器

        金仓技术

        KingBase 金仓数据库

        干货:如何成为AI产品经理?

        科技热闻

        78%开发者已用AI工具:飞算JavaAI「完整工程代码生成」能否改写职场规则?

        飞算JavaAI开发助手

        加密叙事危机:当「传说」构建让位于营销狂欢

        TechubNews

        什么是商业分析报告,怎么制作?AI智能体使用攻略盘点!

        职场工具箱

        人工智能 项目分析报告 AIGC AI智能体 AI 智能体

        通过阿里云Milvus与通义千问VL大模型,快速实现多模态搜索

        阿里云大数据AI技术

        大数据 阿里云 向量检索 多模态 Milvus

        如何做到供应链的协同管理?

        积木链小链

        数字化转型 智能制造 供应链管理

        开发认为测试不及时,测试吐槽工作量太大?

        禅道项目管理

        DevOps 软件开发 效能管理 测试人员 测试效率

        《重塑AI应用架构》系列: Serverless与MCP融合创新,构建AI应用全新智能中枢

        华为云开发者联盟

        ,华为云 华为开发者空间

        媲美Sora?Runaway亮相视频生成模型Gen-3 Alpha,更懂物理世界_生成式 AI_李冬梅_InfoQ精选文章