在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

智谱上线视频生成模型:30 秒生成 6 秒时长,免费不限次!B 站也有研发功劳?

  • 2024-07-27
    北京
  • 本文字数:1300 字

    阅读完需:约 4 分钟

大小:655.85K时长:03:43
智谱上线视频生成模型:30秒生成6秒时长,免费不限次!B 站也有研发功劳?

整理 | 华卫

 

Sora 毫无疑问带来 AI 大模型的全新玩法,大模型可基于任意文字生成视频,包括 Runway 的 Gen 系列、微软的 Nuwa、Meta 的 Emu、谷歌的 Phenaki/VideoPoet、智谱 CogVideo 等。

 

7 月 26 日,智谱 AI CEO 张鹏在智谱 Open Day 上宣布,AI 生成视频模型清影(Ying)正式上线智谱清言,只需要 30 秒时间就能生成 6 秒时长、1440x960 清晰度的 3:2 比例视频。当日起,所有 C 端用户都能通过清影(Ying)体验到 AI 文生视频、图生视频能力。

 


PC 端链接:https://chatglm.cn/video

移动端链接:https://chatglm.cn/download?fr=web_home

 

输入一段文字后(俗称 Prompt),用户可以选择自己想要生成的风格,包括卡通 3D、黑白、油画、电影感等,配上清影自带的音乐,就能够生成充满 AI 想象力的视频片段。

 

除了文本生成视频,也可以到清影上玩图片生成视频。图生视频带来了更多的新玩法,包括表情包梗图、广告制作、剧情创作、短视频创作等。同时,基于清影的「老照片动起来」小程序也会同步上线,只需一步上传老照片,就能让凝练在旧时光中的照片灵动起来。

 

现在,清影(Ying)API 已同步上线大模型开放平台 bigmodel.cn,企业和开发者通过调用 API 的方式,体验和使用文生视频以及图生视频的模型能力。

 

据了解,清影(Ying)的付费方案是:在首发测试期间,所有用户均可免费使用,不限次数。此后,付费 5 元可解锁一天(24 小时)的高速通道权益,付费 199 元可解锁一年的付费高速通道权益。 

 

清影上线后,我们也第一时间测试了它的实际效果。

 

文生视频

 

先来看看对于可爱动物的视频生成效果。我们输入了以下两个提示词:

 

prompt1:两只小浣熊打架抢苹果

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    prompt2:一只奶牛猫在看猫和老鼠的动画片

    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      图生视频

      再来看看对于人类的视频生成效果,我们输入了一张“仕女拉小提琴”的图片:

       


      得到的视频如下:

      00:00 / 00:00
        1.0x
        • 3.0x
        • 2.5x
        • 2.0x
        • 1.5x
        • 1.25x
        • 1.0x
        • 0.75x
        • 0.5x
        网页全屏
        全屏
        00:00


        背后自研技术,推理速度比前代提升 6 倍

        据介绍,清影(Ying)底座的视频生成模型是 CogVideoX,它能将文本、时间、空间三个维度融合起来,参考了 Sora 的算法设计;它也是一个 DiT 架构,通过优化,CogVideoX 相比前代(CogVideo)推理速度提升了 6 倍。

         

        并且,智谱自研了一个端到端视频理解模型,用于为海量的视频数据生成详细的、贴合内容的描述,这样可以增强模型的文本理解和指令遵循能力,使得生成的视频更符合用户的输入,能够理解超长复杂 prompt 指令。

         

        在内容连贯性上,智谱 AI 自研高效三维变分自编码器结构(3D VAE),将原视频空间压缩至 2%大小,配合 3D RoPE 位置编码模块,更有利于在时间维度上捕捉帧间关系,建立起视频中的长程依赖。

         

        该生成式视频模型的研发中,Scaling Law 继续在算法和数据两方面发挥作用。“我们积极在模型层面探索更高效的 scaling 方式。”张鹏表示:“随着算法、数据不断迭代,相信 Scaling Law 将继续发挥强大威力。”

         

        bilibili 作为合作伙伴也参与并支持清影的研发过程。同时,合作伙伴华策影视也参与了模型共建。

         

        此外,智谱 AI 生成式视频研发得到北京市的大力支持,海淀区是智谱 AI 总部所在地,为智谱 AI 开展大模型研发提供了产业投资、算力补贴、应用场景示范、人才等全方位支持。智谱 AI 生成式视频研发算力支持则来自于亦庄集群,目前北京亦庄人工智能公共算力平台已建成。

        2024-07-27 16:008506

        评论

        发布
        暂无评论
        发现更多内容

        区块链Web3项目开发框架

        北京木奇移动技术有限公司

        区块链开发 软件外包公司 web3开发

        CGDC|网易伏羲揭秘AI Agent等技术驱动游戏玩法革新,重塑交互与内容生态

        网易伏羲

        人工智能 ChinaJoy 网易伏羲 游戏AI

        解析 RocketMQ 业务消息——事务消息

        Apache RocketMQ

        RocketMQ 云原生 消息队列 事务消息

        EventBridge 生态实践:融合 SLS 构建一体化日志服务

        Apache RocketMQ

        云原生 事件总线 EventBridge sls

        RocketMQ 5.0 API 与 SDK 的演进

        Apache RocketMQ

        阿里云 RocketMQ 云原生 消息队列

        Fabarta个人专属智能体多版本上线:覆盖多领域,诚邀免费体验!

        Fabarta

        人工智能 智能体 agent

        哪些企业需要私有化部署?有没有推荐的私有化im

        BeeWorks

        即时通讯 IM 私有化部署

        Apache RocketMQ 在阿里云大规模商业化实践之路

        Apache RocketMQ

        阿里云 RocketMQ 云原生 消息队列

        Web3 项目外包开发的类型

        北京木奇移动技术有限公司

        区块链开发 软件外包公司 web3开发

        小红书笔记详情API响应数据解析

        tbapi

        小红书 小红书笔记详情接口 小红书API 小红书数据采集

        高防IP:数字化时代企业网络安全的核心盾牌

        德迅云安全杨德俊

        解析 RocketMQ 业务消息--顺序消息

        Apache RocketMQ

        RocketMQ 云原生 消息队列 消息集成 mq消息集成

        生成式AI实现多模态信息检索新突破

        qife122

        机器学习 生成式AI

        我试用了5款文本配音工具后的真实感受

        石臻臻的杂货铺

        AI TTS 文本转语音

        Mac系统编程入门指南:从环境配置到高效编码

        qife122

        命令行工具 Mac开发

        从技术架构到场景落地:JetLinks 与 MyEMS 的差异化路径与价值解析

        开源能源管理系统

        开源 开源能源管理系统

        RocketMQ 客户端负载均衡机制详解及最佳实践

        Apache RocketMQ

        阿里云 RocketMQ 云原生 消息队列

        RocketMQ 重试机制详解及最佳实践

        Apache RocketMQ

        阿里云 RocketMQ 云原生 消息队列

        阿里云基于全新 RocketMQ 5.0 内核的落地实践

        Apache RocketMQ

        阿里云 RocketMQ 云原生 消息队列

        RocketMQ 消息集成:多类型业务消息——定时消息

        Apache RocketMQ

        阿里云 RocketMQ 云原生 消息队列 定时消息

        2025大模型应用平台选型指南:从个人助手到企业级智能体

        测试人

        瑞士开源大语言模型今夏发布

        qife122

        大语言模型 多语言处理

        为什么海外舆情监测将成为品牌出海的底层能力?

        沃观Wovision

        出海企业 海外舆情监控 沃观Wovision 舆情监测系统

        开源驱动下的能源管理革新:安全自主可控与 MyEMS 的实践路径

        开源能源管理系统

        开源 开源能源管理系统

        分库分表之后如何使用?面试可以参考这些话术

        王中阳Go

        面试 分库分表

        开源赋能双碳:MyEMS 能源管理系统的架构与实践价值

        开源能源管理系统

        开源 开源能源管理系统 国能国标

        AI少儿英语背单词APP的开发流程

        北京木奇移动技术有限公司

        软件外包公司 APP外包公司 AI英语学习

        私有化部署即时通讯,企业专属通讯系统BeeWorks

        BeeWorks

        即时通讯 IM 私有化部署

        解析 RocketMQ 多样消费功能-消息过滤

        Apache RocketMQ

        阿里云 云原生 消息队列 消息过滤

        CST补丁安装教程-CST Studio Suite 2022 SP4 补丁包

        思茂信息

        cst CST软件 CST Studio Suite

        JimuReport 积木报表 v2.1.1 版本发布,免费开源的报表和大屏设计

        JEECG低代码

        数据可视化 报表 数据大屏 报表工具 数据BI

        智谱上线视频生成模型:30秒生成6秒时长,免费不限次!B 站也有研发功劳?_生成式 AI_华卫_InfoQ精选文章