写点什么

即梦 AI 上线 “动作模仿” 功能:一键让图片人物动起来

即梦 AI

  • 2025-03-05
    北京
  • 本文字数:700 字

    阅读完需:约 2 分钟

大小:365.81K时长:02:04
即梦 AI 上线 “动作模仿” 功能:一键让图片人物动起来

3 月 5 日,即梦 AI 上线“动作模仿”功能,用户从“数字人”入口进入,只需上传一张人物图片和一条参考视频,就能生成一条动态视频,让图片里的人物模拟参考视频中的人物动作,连情绪都能一比一还原。该功能支持包括肖像、半身以及全身在内的不同画幅,为用户提供更广阔的创作空间,更好地满足其创作需求。


图说:即梦“动作模仿”功能入口和玩法示意


据介绍,即梦 AI“动作模仿”功能由字节跳动智能创作数字人团队提供技术支持。2024 年 11 月,该团队自研的前一代技术成果 X- Portrait2 就曾凭借精准的动作控制和高保真的表情迁移效果,受到国内外技术领域的高度关注。本次,团队升级了技术方案,采用显式和隐式特征混合驱动的方式,能够同步还原各种画幅下的肢体动作和人脸表情;在人脸表情控制方面,凭借自研的 face motion tokenizer,能够精准地从驱动视频中抓取表情细节,显著提升生成视频的生动性。


目前,即梦 AI 官方提供了 3 个动作模板,并支持用户自行上传本地文件,视频时长最长为 30 秒。为保证功能被安全、恰当地使用,即梦官方特别提醒,用户上传视频素材需确保拥有合法授权,平台会对视频内容进行严格的安全审核,并对输出视频添加“AI 生成”水印。


即梦 AI 是字节跳动旗下的 AI 内容平台,支持通过自然语言及图片输入,生成高质量的图像及视频。平台提供智能画布、故事创作模式,以及首尾帧、对口型、运镜控制、速度控制等 AI 编辑能力,并有海量影像灵感及兴趣社区,一站式提供用户创意灵感、流畅工作流、社区交互等资源,为用户的创作提效。


即梦 AI 相关负责人表示,“动作模仿”在即梦 App 和 Web 端均已上线,该功能是其在视频创作领域的一次新探索,希望可以帮助用户更加精准地实现 AI 视频生成,激发更多灵感创意。

 

2025-03-05 15:264878

评论

发布
暂无评论

近邻搜索算法浅析

得物技术

深度学习 算法 Faiss 近邻搜索 乘积量化

Python爬虫抢购某宝秒杀商品

弑着去忘记う

后端

安全狗《云原生安全威胁分析报告》首次提出双检测模型

极客天地

大数据培训学习开发技术费用

小谷哥

java培训机构与自学的优缺点有什么

小谷哥

SpringBoot如何优雅地进行响应数据封装、异常处理?

程序员小毕

Java 源码 程序员 面试 spring-boot

如何在 UE4 中制作一扇自动开启的大门

HelloWorld杰少

8月月更

拿来即用!Get计算机视觉核心知识,看这本书就够了!

博文视点Broadview

七夕专属限定:1 分钟 Serverless 极速抽盲盒

hum建应用专家

云计算 Serverless

浅谈程序员的职业操守

阿里技术

fastposter v2.9.0 程序员必备海报生成器

物有本末

fastposter 海报生成器 海报编辑器 海报生成 图片生成

web前端面授培训课程

小谷哥

易观分析:2022年Q2中国网络零售B2C市场交易规模达23444.7亿元

易观分析

B2C 网络零售

字节算法大神手写算法笔记,已连续多次霸榜 GitHub Trending 首页

冉然学Java

GitHub 算法 Java 分布式 字节

大型连锁百货运维审计用什么软件好?有哪些功能?

行云管家

IT运维 运维审计 运维软件 百货

树莓派 USB摄像头 实现网络监控( MJPG-Streamer)

Five

树莓派 网络监控 #web 8月月更

Tinymce plugins [Tinymce扩展插件集合]

Five

插件开发 tinymce 富文本编辑器 8月月更

使用域名注册服务 Domains配置域名【华为云至简致远】

科技云未来

域名配置 端口映射

《数字经济全景白皮书》金融数字用户篇 重磅发布!

易观分析

金融 数字用户

超多精美礼品等你来拿!2022年中国混沌工程调查启动

混沌工程实验室

混沌工程

TiFlash 计算层概览

TiDB 社区干货传送门

数据库 分布式数据库 TiDB

什么是研发效能的「黄金三角」?如何助力企业提升效能?

万事ONES

前端高频面试题

helloworld1024fd

leetcode 448. Find All Numbers Disappeared in an Array 找到所有数组中消失的数字(简单)

okokabcd

数组 LeetCode 数据结构与算法

阿里巴巴2022最新Java架构师进阶宝典!助力程序员金九银十面试跳槽涨薪

程序员小毕

Java 程序员 架构 面试 算法

源码阅读其实很简单!阿里业务架构师手写JDK源码笔记(2022版)真香

Java永远的神

Java 程序员 面试 程序人生 jdk源码

Android技术分享| 一对一音视频呼叫邀请开发流程(一)

anyRTC开发者

android 音视频 移动开发 视频通话 呼叫邀请

Mysql重启后innodb和myisam插入的主键id变化总结

知识浅谈

8月月更

tinymce 如何实现动态国际化

Five

插件开发 tinymce 富文本编辑器 8月月更

Webpack5新特性:使用 Assets Module 处理图片和字体资源

昆吾kw

前端 前端工程化 webpack

通过Gitea实现内外网repo管理

吴脑的键客

git

即梦 AI 上线 “动作模仿” 功能:一键让图片人物动起来_字节跳动_InfoQ精选文章