写点什么

腾讯开源轻量级视频生成模型 HunyuanVideo 1.5,消费级显卡可部署

  • 2025-11-21
    北京
  • 本文字数:1233 字

    阅读完需:约 4 分钟

大小:584.76K时长:03:19
腾讯开源轻量级视频生成模型HunyuanVideo 1.5,消费级显卡可部署

刚刚,腾讯混元大模型团队正式发布并开源 HunyuanVideo 1.5,一款基于 Diffusion Transformer(DiT)架构、参数为 8.3B 的轻量级视频生成模型,支持生成 5-10 秒的高清视频。


目前,腾讯元宝最新版已上线该模型能力。用户可通过两种方式即可体验:一是输入文字描述(Prompt),直接实现“文生视频”;二是上传图片配合 Prompt,轻松将静态图片转化为动态视频。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    文生视频提示词:一个人在电话里对家人报喜不报忧,用轻快的声音聊天。他脸上努力维持着开朗的笑容,但眼眶却不由自主地泛红,在挂断电话的瞬间,笑容瞬间垮掉,化为一声无声的叹息,手疲惫地捂住眼睛。)

     

    根据介绍,HunyuanVideo 1.5 模型支持中英文输入的文生视频与图生视频。


    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      文生视频提示词:一只破旧的棕色皮质手提箱,黄铜搭扣,静静地躺在明亮的阁楼地板上。起初,搭扣微微颤动,随后弹开,箱盖大开。箱子里装满了深色的泥土。接下来,一段令人叹为观止的延时生长过程开始了:细小的绿色芽破土而出,枝繁叶茂,长成微型树木,鲜艳的花朵竞相绽放。鹅卵石小径逐渐形成,一张小木凳凭空出现,池塘水面泛起涟漪。最终,一个完美精致的微型英式花园在箱子里徐徐展开。固定中景镜头,略微俯拍。明亮的自然光,柔和的阴影,以及细小的尘埃。逼真、神奇、细节丰富的转变,8K 分辨率。


      模型还具备强指令理解与遵循能力,能够精准地实现多样化场景,包括运镜、流畅运动、写实人物和人物情绪表情等多种指令;同时支持写实、动画、积木等多种风格,并可在视频中生成中英文文字。


      00:00 / 00:00
        1.0x
        • 3.0x
        • 2.5x
        • 2.0x
        • 1.5x
        • 1.25x
        • 1.0x
        • 0.75x
        • 0.5x
        网页全屏
        全屏
        00:00


        文生视频提示词:一段充满电影感的东京夜景,展现了熙熙攘攘的十字路口。镜头以高角度广角拍摄,展现了人群和霓虹灯,随后迅速拉近,聚焦于一位年轻的女性。她静立于模糊的喧嚣之中,若有所思。画面以忧郁的蓝红色灯光、湿漉漉的沥青路面倒映的影像以及浅景深为特色。


        在画质方面,模型可原生生成 5–10 秒时长的 480p 和 720p 高清视频,并可通过超分模型提升至 1080p 电影级画质。

         

        腾讯介绍,此前,视频生成领域的开源 SOTA 旗舰模型至少有 20B,需要超过 50GB 显卡方可部署。HunyuanVideo 1.5 定位为“开源小钢炮”,以极轻量的 8.3B 尺寸实现开源最佳的效果;显著降低了使用门槛,甚至可在 14G 显存的消费级显卡上流畅运行,真正让每一位开发者和创作者都能“玩起来”。

         HunyuanVideo 1.5 GSB(Good Same Bad) 评测结果

         

        据悉,HunyuanVideo1.5 通过多层次的技术创新,实现了生成效果、性能与尺寸上的平衡。HunyuanVideo 1.5 创新的 SSTA 稀疏注意力机制(全称 Selective and Sliding Tile Attention, 选择性滑动分块注意力)在保证高质量生成的同时显著提升推理效率,配合多阶段渐进式训练策略,在运动连贯性、语义遵循等关键维度均达到商用水平。


        项目相关链接


        项目主页:https://hunyuan.tencent.com/video/zh

        Github:https://github.com/Tencent-Hunyuan/HunyuanVideo-1.5

        Hugging Face:https://huggingface.co/tencent/HunyuanVideo-1.5

        技术报告:https://github.com/Tencent-Hunyuan/HunyuanVideo-1.5/blob/main/assets/HunyuanVideo_1_5.pdf

         

        2025-11-21 14:446

        评论

        发布
        暂无评论

        深入了解手机App开发:从构思到上线的全过程

        天津汇柏科技有限公司

        数字化转型 低代码开发 定制软件开发 软件开发定制

        教你用Ubuntu快速搭建饥荒服务器

        华为云开发者联盟

        开发 华为云 华为云开发者联盟 华为云服务器 饥荒

        2024中国云计算大分野:重回当年,还是走向未来?

        脑极体

        云计算

        读TiDB源码聊设计:引子

        泊浮目

        分布式数据库 TiDB HTAP

        LED户外广告屏寿命的关键因素及解决方案

        Dylan

        广告 维护 系统维护 LED显示屏 户外LED显示屏

        华为云命令行工具KooCLI—高效云端管理的秘诀

        云计算 API 华为云

        JavaScript之structuredClone现代深拷贝

        南城FE

        JavaScript 前端 深拷贝

        内含资料下载丨黄东旭:2024 现代应用开发关键趋势——降低成本、简化架构

        PingCAP

        数据库 TiDB AI技术 应用开发

        为什么说 TiDB 在线扩容对业务几乎没有影响

        PingCAP

        数据库 TiDB TiKV

        【FAQ】HarmonyOS SDK 闭源开放能力 —Account Kit

        HarmonyOS SDK

        HarmonyOS

        Python黑科技揭秘:多窗口操作不再是难题,这些技巧让你轻松搞定

        测试人

        Python 软件测试 自动化测试 测试开发

        探索Terraform实践:优化基础设施管理

        SEAL安全

        架构 运维 Terraform

        国内主流AI大模型都是Python 开发的,国外AI大模型是什么语言开发的?为什么要用python?

        算法的秘密

        QCN9274/Super WiFi 7: Explore the unlimited potential of next-generation networks

        wallysSK

        Dapp/DeFi/Swap交易所代币质押项目挖矿系统开发详情

        l8l259l3365

        OpenAI文生视频大模型Sora:重塑视频内容生产

        百度开发者中心

        视频 大模型 人工智能、

        AI大模型的发展趋势与应用前景

        百度开发者中心

        AI 大模型 人工智能、

        如何防止 Elasticsearch 服务 OOM ?

        极限实验室

        ES console Gateway easysearch

        AmzTrends x TiDB Serverless:通过云原生改造实现全局成本降低 80%

        PingCAP

        数据库 数据分析 云原生 TiDB

        Selenium帮助你轻松实现浏览器多窗口操作

        霍格沃兹测试开发学社

        Amazon Q :企业级的对话智能导航

        亚马逊云科技 (Amazon Web Services)

        掰扯掰扯需求分析:从工程到生活中的4个case

        泊浮目

        系统设计 需求分析

        RDS for MySQL Serverless公测上线:弹性伸缩,最高可降成本超80%

        华为云开发者联盟

        数据库 后端 华为云 华为云开发者联盟 华为云Serverless

        春招开始,面试也多起来了

        王磊

        Java 面试

        Python黑科技揭秘:多窗口操作不再是难题,这些技巧让你轻松搞定

        测吧(北京)科技有限公司

        测试

        请查收!“全国大学生智能汽车竞赛”线上赛备赛指南

        飞桨PaddlePaddle

        人工智能 百度 AI BAIDU 百度飞桨

        详解Python中sys模块的功能与应用

        华为云开发者联盟

        Python 开发 华为云 函数 华为云开发者联盟

        请认真对待你的简历

        老张

        面试 简历优化 简历

        腾讯开源轻量级视频生成模型HunyuanVideo 1.5,消费级显卡可部署_AI&大模型_褚杏娟_InfoQ精选文章