写点什么

百度又放大招!视觉生成模型 Hallo2 或将落地数字人等场景

  • 2024-10-24
    北京
  • 本文字数:722 字

    阅读完需:约 2 分钟

大小:354.10K时长:02:00
百度又放大招!视觉生成模型Hallo2或将落地数字人等场景

近日,百度联合复旦大学等发布 Hallo2,一个可以生成长达数小时且分辨率为 4K 的人物动画的视觉模型。Hallo2 目前已经在 GitHub 平台开源,供全球开发者免费使用和研究,预计将促进视频生成技术的广泛应用和发展。(项目地址:https://fudan-generative-vision.github.io/hallo2/#/



Hallo2 发布后,在海外引发了不小的震动。有人惊叹视频生成的长度和分辨率,也有老用户从 Hallo 第一代模型就被圈粉,还有对 Hallo2 开源模型和代码的认可。

Hallo2 备受关注,很重要一个原因是百度和复旦的研究团队解决了人像视频生成一个很大的痛点:如何提升视频生成的时长和质量。



一直以来,生成高质量的人物动画需要耗费大量的时间和人力成本。而百度与复旦联合发布的 Hallo2 的出现,有望彻底改变这一现状,为数字人、电影制作、虚拟助手、游戏开发等领域带来革命性的变化。




Hallo2 是能够实现长达一小时、4K 分辨率的音频驱动人像动画生成模型。通过创新的图像块丢弃、噪声增强和时间对齐等技术,Hallo2 解决了长时视频生成中的外观漂移和视觉不一致问题,支持灵活的语音与文本控制,生成质量达到业内领先水平。

Hallo2 继承了前代 Hallo 模型的创新框架,继续采用基于扩散的生成模型和分层音频驱动视觉合成模块,提高了音频与视觉输出之间的同步精度,并经过改进使得各部分的协同作用更加高效,增强了生成动画的质量和真实感。此外,Hallo2 不仅在图像和视频的质量方面有了显著提升,而且大幅增加了动作的丰富性和多样性。

有行业专家表示,Hallo2 的出现,标志着音频驱动的肖像图像动画技术迈入了新的发展阶段。百度基于长期的视觉技术积累,正在瞄准行业痛点进行针对性研究和场景落地,不仅为开发者提供了强大的工具,也为未来各种应用场景下的动画形象创作带来了新的可能性。



2024-10-24 17:369017

评论

发布
暂无评论
发现更多内容

【SpringBoot技术专题】「JWT技术专区」SpringSecurity整合JWT授权和认证实现

码界西柚

spring security springboot JWT 8月日更

AOC萌新探索:搭建和体验在线AOC环境

华为云开发者联盟

Python 网络 自动化运维 AOC 网络设备

MySQL 系列教程之(五)DDL 操作:建库建表

若尘

MySQL 数据库 8月日更

堡垒机、防火墙以及跳板机分别是什么?

行云管家

云计算 运维 防火墙 堡垒机 跳板机

“遇见”未来“编程”语言,面向组件编程,送给在校学生

清风

Java 小程序 毕业设计

30个Kafka常见错误小集合

王知无

Android ANR应用无响应

W🌥

android 8月日更

Hadoop安装与常用操作命令

Mike

MySQL安全加固方法分享

Simon

MySQL 数据库 数据安全

基于java springboot体育馆预约微信小程序源码(毕设)设计开发

清风

Java 小程序 源码 毕业设计

走!跟着浪潮云洲去挖矿

云计算

零代码以“王者荣耀”为例解析设计七原则

华为云开发者联盟

软件 设计原则 王者荣耀 单一职责

如何将知识引入机器学习模型提升泛化能力?

华为云开发者联盟

机器学习 算法 数据 模型 物理学

Hadoop生态系统

Mike

史上最全Linux可观测最佳实践分享!建议先收藏~

观测云

云计算 Linux

爬虫遇到反爬机制怎么办? 看看我是如何解决的!

Python研究者

8月日更

出现吧,Python Web 菜谱系统的首页,不会前端技术,也能做

梦想橡皮擦

8月日更

技术加持、服务先行:北鲲云超算平台助力生命科学领域研究与发展

北鲲云

摊牌了!哈利波特的“隐形斗篷”就是我想要的

百度开发者中心

人工智能 AI 最佳实践 行业资讯

博文干货|5张图带你快速入门 Pulsar 的存储引擎 BookKeeper

Apache Pulsar

pulsar bookKeeper

fil有投资价值吗?投资fil的方式有哪些?

区块链 分布式存储 IPFS fil FIL投资

Vue进阶(三十八):v-for 中 :key 到底有什么用?

No Silver Bullet

Vue key 8月日更

sql task01 环境搭建

橙橙橙橙汁丶

区块链技术:为什么说波卡能加速区块链行业的发展?

CECBC

能源区块链研究 | 加密行业碳抵消有助于大众接纳比特币吗?

CECBC

【LeetCode】有效的字母异位词Java题解

Albert

算法 LeetCode 8月日更

架构实战营-模块二作业

俞立夫

架构实战营

2021,编程语言如何选择?

程序员鱼皮

Java c++ Python JavaScript Go 语言

复旦大学附属中山医院钱琨:健康医疗大数据时代下的智慧医院建设

星环科技

大数据 医疗 数据能力

合约量化交易系统开发技术

薇電13242772558

区块链

《程序员修炼之道 - 从小工到专家》吐血解读

博文视点Broadview

百度又放大招!视觉生成模型Hallo2或将落地数字人等场景_生成式 AI_华卫_InfoQ精选文章