写点什么

智谱上线视频生成模型:30 秒生成 6 秒时长,免费不限次!B 站也有研发功劳?

  • 2024-07-27
    北京
  • 本文字数:1300 字

    阅读完需:约 4 分钟

大小:655.85K时长:03:43
智谱上线视频生成模型:30秒生成6秒时长,免费不限次!B 站也有研发功劳?

整理 | 华卫

 

Sora 毫无疑问带来 AI 大模型的全新玩法,大模型可基于任意文字生成视频,包括 Runway 的 Gen 系列、微软的 Nuwa、Meta 的 Emu、谷歌的 Phenaki/VideoPoet、智谱 CogVideo 等。

 

7 月 26 日,智谱 AI CEO 张鹏在智谱 Open Day 上宣布,AI 生成视频模型清影(Ying)正式上线智谱清言,只需要 30 秒时间就能生成 6 秒时长、1440x960 清晰度的 3:2 比例视频。当日起,所有 C 端用户都能通过清影(Ying)体验到 AI 文生视频、图生视频能力。

 


PC 端链接:https://chatglm.cn/video

移动端链接:https://chatglm.cn/download?fr=web_home

 

输入一段文字后(俗称 Prompt),用户可以选择自己想要生成的风格,包括卡通 3D、黑白、油画、电影感等,配上清影自带的音乐,就能够生成充满 AI 想象力的视频片段。

 

除了文本生成视频,也可以到清影上玩图片生成视频。图生视频带来了更多的新玩法,包括表情包梗图、广告制作、剧情创作、短视频创作等。同时,基于清影的「老照片动起来」小程序也会同步上线,只需一步上传老照片,就能让凝练在旧时光中的照片灵动起来。

 

现在,清影(Ying)API 已同步上线大模型开放平台 bigmodel.cn,企业和开发者通过调用 API 的方式,体验和使用文生视频以及图生视频的模型能力。

 

据了解,清影(Ying)的付费方案是:在首发测试期间,所有用户均可免费使用,不限次数。此后,付费 5 元可解锁一天(24 小时)的高速通道权益,付费 199 元可解锁一年的付费高速通道权益。 

 

清影上线后,我们也第一时间测试了它的实际效果。

 

文生视频

 

先来看看对于可爱动物的视频生成效果。我们输入了以下两个提示词:

 

prompt1:两只小浣熊打架抢苹果

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    prompt2:一只奶牛猫在看猫和老鼠的动画片

    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      图生视频

      再来看看对于人类的视频生成效果,我们输入了一张“仕女拉小提琴”的图片:

       


      得到的视频如下:

      00:00 / 00:00
        1.0x
        • 3.0x
        • 2.5x
        • 2.0x
        • 1.5x
        • 1.25x
        • 1.0x
        • 0.75x
        • 0.5x
        网页全屏
        全屏
        00:00


        背后自研技术,推理速度比前代提升 6 倍

        据介绍,清影(Ying)底座的视频生成模型是 CogVideoX,它能将文本、时间、空间三个维度融合起来,参考了 Sora 的算法设计;它也是一个 DiT 架构,通过优化,CogVideoX 相比前代(CogVideo)推理速度提升了 6 倍。

         

        并且,智谱自研了一个端到端视频理解模型,用于为海量的视频数据生成详细的、贴合内容的描述,这样可以增强模型的文本理解和指令遵循能力,使得生成的视频更符合用户的输入,能够理解超长复杂 prompt 指令。

         

        在内容连贯性上,智谱 AI 自研高效三维变分自编码器结构(3D VAE),将原视频空间压缩至 2%大小,配合 3D RoPE 位置编码模块,更有利于在时间维度上捕捉帧间关系,建立起视频中的长程依赖。

         

        该生成式视频模型的研发中,Scaling Law 继续在算法和数据两方面发挥作用。“我们积极在模型层面探索更高效的 scaling 方式。”张鹏表示:“随着算法、数据不断迭代,相信 Scaling Law 将继续发挥强大威力。”

         

        bilibili 作为合作伙伴也参与并支持清影的研发过程。同时,合作伙伴华策影视也参与了模型共建。

         

        此外,智谱 AI 生成式视频研发得到北京市的大力支持,海淀区是智谱 AI 总部所在地,为智谱 AI 开展大模型研发提供了产业投资、算力补贴、应用场景示范、人才等全方位支持。智谱 AI 生成式视频研发算力支持则来自于亦庄集群,目前北京亦庄人工智能公共算力平台已建成。

        2024-07-27 16:007547

        评论

        发布
        暂无评论
        发现更多内容

        Mac母带制作工具Steinberg WaveLab 12 Pro下载安装

        南屿

        Steinberg 母带处理软件 WaveLab 12

        数据中心AIOps智能运维标杆 浪潮信息InManage全新升级

        财见

        连续四次登顶!天翼云稳居中国专属云服务市场第一

        天翼云开发者社区

        云计算 云服务 IDC

        一个响指,代码生成!华为云CodeArts Snap正式公测

        人工智能 华为云

        在线视频转Mp3软件4K YouTube to MP3中文直装版

        南屿

        音频提取工具 音频转换 MP3

        为什么跨境电商成为海外云手机的主要受众群体?

        Ogcloud

        云手机 海外云手机 跨境电商云手机 云手机海外版

        macOS数据转换工具 Easy Data Transform for mac v1.46.2激活版

        南屿

        Excel CSV编程文件转换 数据转换工具 Easy Data Transform

        苹果电脑实用工具:Unclutter for mac 下拉菜单隐藏工具

        南屿

        正式发布!《ICPMM行业云平台运营管理能力成熟度》系列标准来了!

        天翼云开发者社区

        云计算 云服务 企业上云

        软件测试学习笔记丨Flask环境安装

        测试人

        软件测试

        国内首个图计算标准发布,悦数图数据库通过测试

        悦数图数据库

        图谱

        苹果电脑mac上好用10款系统优化软件

        南屿

        苹果mac系统优化 Mac卸载软件

        2024年前端会流行什么技术和框架了?

        互联网工科生

        软件开发 低代码 前端框架 JNPF

        彰显科技硬实力!天翼云论文在国际顶刊JoCCASA发表!

        天翼云开发者社区

        云计算 混合云 论文

        一文深度解读多模态大模型视频检索技术的实现与使用

        阿里云CloudImagine

        云计算 大模型 视频云

        使用云手机运营TikTok,实现更多可能性

        Ogcloud

        云手机 海外云手机 tiktok云手机 云手机海外版

        Higress 开源一周年:新版本,新标准,新工具,新征程

        阿里巴巴云原生

        阿里云 开源 云原生 Higress

        减少文件体积优化性能,你的姿势对了吗?

        Yestodorrow

        云原生 前端开发 可观测性 用户体验 网站性能

        区块链开发项目:构建去中心化未来的蓝图

        区块链软件开发推广运营

        dapp开发 区块链开发 链游开发 NFT开发 公链开发

        软件测试学习笔记丨Flask定义接口路由和视图函数

        测试人

        软件测试

        JetBrains软件怎么设置中文,jetbrains全家桶汉化教程

        南屿

        编程开发 jetbrains rider破解版 JetBrains全家桶

        大模型+知识图谱双驱架构:新一代《知识语义框架SPG》白皮书

        可信AI进展

        知识图谱 大模型

        下一代软件架构,如何构建微服务核心能力

        阿里巴巴云原生

        阿里云 Serverless 微服务 云原生

        智谱上线视频生成模型:30秒生成6秒时长,免费不限次!B 站也有研发功劳?_生成式 AI_华卫_InfoQ精选文章