10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

智谱上线视频生成模型:30 秒生成 6 秒时长,免费不限次!B 站也有研发功劳?

  • 2024-07-27
    北京
  • 本文字数:1300 字

    阅读完需:约 4 分钟

大小:655.85K时长:03:43
智谱上线视频生成模型:30秒生成6秒时长,免费不限次!B 站也有研发功劳?

整理 | 华卫

 

Sora 毫无疑问带来 AI 大模型的全新玩法,大模型可基于任意文字生成视频,包括 Runway 的 Gen 系列、微软的 Nuwa、Meta 的 Emu、谷歌的 Phenaki/VideoPoet、智谱 CogVideo 等。

 

7 月 26 日,智谱 AI CEO 张鹏在智谱 Open Day 上宣布,AI 生成视频模型清影(Ying)正式上线智谱清言,只需要 30 秒时间就能生成 6 秒时长、1440x960 清晰度的 3:2 比例视频。当日起,所有 C 端用户都能通过清影(Ying)体验到 AI 文生视频、图生视频能力。

 


PC 端链接:https://chatglm.cn/video

移动端链接:https://chatglm.cn/download?fr=web_home

 

输入一段文字后(俗称 Prompt),用户可以选择自己想要生成的风格,包括卡通 3D、黑白、油画、电影感等,配上清影自带的音乐,就能够生成充满 AI 想象力的视频片段。

 

除了文本生成视频,也可以到清影上玩图片生成视频。图生视频带来了更多的新玩法,包括表情包梗图、广告制作、剧情创作、短视频创作等。同时,基于清影的「老照片动起来」小程序也会同步上线,只需一步上传老照片,就能让凝练在旧时光中的照片灵动起来。

 

现在,清影(Ying)API 已同步上线大模型开放平台 bigmodel.cn,企业和开发者通过调用 API 的方式,体验和使用文生视频以及图生视频的模型能力。

 

据了解,清影(Ying)的付费方案是:在首发测试期间,所有用户均可免费使用,不限次数。此后,付费 5 元可解锁一天(24 小时)的高速通道权益,付费 199 元可解锁一年的付费高速通道权益。 

 

清影上线后,我们也第一时间测试了它的实际效果。

 

文生视频

 

先来看看对于可爱动物的视频生成效果。我们输入了以下两个提示词:

 

prompt1:两只小浣熊打架抢苹果

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    prompt2:一只奶牛猫在看猫和老鼠的动画片

    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      图生视频

      再来看看对于人类的视频生成效果,我们输入了一张“仕女拉小提琴”的图片:

       


      得到的视频如下:

      00:00 / 00:00
        1.0x
        • 3.0x
        • 2.5x
        • 2.0x
        • 1.5x
        • 1.25x
        • 1.0x
        • 0.75x
        • 0.5x
        网页全屏
        全屏
        00:00


        背后自研技术,推理速度比前代提升 6 倍

        据介绍,清影(Ying)底座的视频生成模型是 CogVideoX,它能将文本、时间、空间三个维度融合起来,参考了 Sora 的算法设计;它也是一个 DiT 架构,通过优化,CogVideoX 相比前代(CogVideo)推理速度提升了 6 倍。

         

        并且,智谱自研了一个端到端视频理解模型,用于为海量的视频数据生成详细的、贴合内容的描述,这样可以增强模型的文本理解和指令遵循能力,使得生成的视频更符合用户的输入,能够理解超长复杂 prompt 指令。

         

        在内容连贯性上,智谱 AI 自研高效三维变分自编码器结构(3D VAE),将原视频空间压缩至 2%大小,配合 3D RoPE 位置编码模块,更有利于在时间维度上捕捉帧间关系,建立起视频中的长程依赖。

         

        该生成式视频模型的研发中,Scaling Law 继续在算法和数据两方面发挥作用。“我们积极在模型层面探索更高效的 scaling 方式。”张鹏表示:“随着算法、数据不断迭代,相信 Scaling Law 将继续发挥强大威力。”

         

        bilibili 作为合作伙伴也参与并支持清影的研发过程。同时,合作伙伴华策影视也参与了模型共建。

         

        此外,智谱 AI 生成式视频研发得到北京市的大力支持,海淀区是智谱 AI 总部所在地,为智谱 AI 开展大模型研发提供了产业投资、算力补贴、应用场景示范、人才等全方位支持。智谱 AI 生成式视频研发算力支持则来自于亦庄集群,目前北京亦庄人工智能公共算力平台已建成。

        2024-07-27 16:007833

        评论

        发布
        暂无评论
        发现更多内容

        传输线路动态巡检探索

        鲸品堂

        网络 传输网络

        【Ajax】全面了解http协议

        坚毅的小解同志

        HTTP 11月月更

        ArkUI框架基于鸿蒙系统的Scroll和Scroller和自定义组件之插槽的实战案例心得

        恒山其若陋兮

        前端 11月月更

        【Ajax】如何通过axios发起Ajax请求

        坚毅的小解同志

        ajax 11月月更

        4.0体验站|OceanBase 4.0 我回来给你点个赞

        OceanBase 数据库

        “如何实现高效的应用交付”鲁班会开发者训练营厦门站进行时

        华为云开发者联盟

        云计算 软件开发 华为云 应用集成

        计算机网络:数据链路层设备

        timerring

        计算机网络 11月月更 网桥

        不懂Hybird开发,感觉错过一个亿~

        FinFish

        小程序 前端框架 APP开发 APP软件开发、 混合开发

        基于Spring-AOP的自定义分片工具

        京东科技开发者

        aop 数据分片 spring aop 配置文件

        旺链科技肖慧荣登超级账本2022年第三季度中国贡献榜

        旺链科技

        区块链 产业区块链 VoneBaaS 企业号十月PK榜

        数维图智慧化工园区三维系统 助力危化企业安全生产

        2D3D前端可视化开发

        物联网 数据可视化 数字孪生 智慧化工园区 化工园区三维可视化

        LR低代码快速开发平台 高效调整企业组织架构

        力软低代码开发平台

        基于鸿蒙系统的ArkUI框架的公共剪切类属性和多态样式在前后端分离项目中的表现

        恒山其若陋兮

        11月月更

        深度解析KubeEdge EdgeMesh 高可用架构

        华为云开发者联盟

        云计算 云原生 后端 华为云

        一个宁静祥和没有bug的下午和SqlSession的故事

        京东科技开发者

        mybatis sql Spring Boot CLI SQLSession

        Bigkey问题的解决思路与方式探索

        vivo互联网技术

        redis dba bigkey

        OpenHarmony 3.2 Beta多媒体系列——音视频播放框架

        OpenHarmony开发者

        OpenHarmony

        【Ajax】如何通过axios发起Ajax请求

        坚毅的小解同志

        ajax 11月月更

        鸿蒙系统ARKUI框架对于分布式计算和请求API的实战研究

        恒山其若陋兮

        前端 11月月更

        【jquery ajax】实现文件上传提交

        坚毅的小解同志

        ajax 11月月更

        【原生Ajax】全面了解xhr的概念与使用。

        坚毅的小解同志

        ajax 11月月更

        大模型狂欢背后:AI基础设施的“老化”与改造工程

        OneFlow

        人工智能 深度学习 大模型

        字节跳动基于数据湖技术的近实时场景实践

        字节跳动数据平台

        数据湖 火山引擎

        度量BGP监测源数量对AS可见性的影响

        郑州埃文科技

        AS IP地址 BGP数据源

        元器件科普|变压器的分类及形状构造

        元器件秋姐

        元器件采购 华秋商城 变压器 电感器 电压

        通过实战总结的 使用Go的小技巧

        王中阳Go

        Go golang 高效工作 学习方法 11月月更

        提升80%上云集成效率, TA是如何做到的

        华为云开发者联盟

        云计算 后端 华为云 云集成

        【web 开发基础】PHP 变量的作用范围 (29)

        迷彩

        作用域 静态变量 全局变量 局部变量 11月月更

        5分钟搭建图片压缩应用

        华为云开发者联盟

        云计算 后端 华为云 函数工作流

        【Ajax进阶】跨域和JSONP的学习

        坚毅的小解同志

        ajax 11月月更

        Go定时任务源码 - robfig/cron

        人生如梦

        Go 定时任务 cron

        智谱上线视频生成模型:30秒生成6秒时长,免费不限次!B 站也有研发功劳?_生成式 AI_华卫_InfoQ精选文章