写点什么

罗永浩数字人带货赚了 5500 万!百度首度公开 4 项技术突破,将砸 1 亿再造 10 万数字人主播

  • 2025-06-18
    北京
  • 本文字数:2083 字

    阅读完需:约 7 分钟

大小:1.04M时长:06:02
罗永浩数字人带货赚了5500万!百度首度公开4项技术突破,将砸1亿再造10万数字人主播

整理|华卫

 

6 月 17 日,在百度 AI Day 开放日上,百度官宣打造业界首个超头主播罗永浩数字人,并发布了高说服力数字人的四大技术突破。此前,罗永浩数字人直播首秀创下超 1300 万人次观看、GMV 突破 5500 万元的行业新纪录,部分核心品类带货量反超真人直播。

 

“百度的罗永浩数字人已达到媲美超头主播的体感效果,随着大模型与多模能力发展,数字人未来超越真人效果极具潜力。”百度副总裁、电商总经理平晓黎表示,新一代高说服力数字人成为了一个像真人一样,形神音容高度协调、会思考决策、能协作完成特定任务的超级智能体。



数字人生成过程揭秘:4 项新突破

在高说服力数字人的基础之上,百度电商慧播星再一次迭代,围绕慧播星首席体验官罗永浩,发布了业界首个超头主播的数字人,并实现了体验、内容、视觉、效果的四大突破。

 

首先是体验突破,通过复刻罗永浩跟朱萧木的丝滑配合,上线了业界首个双数字人互动直播间,给营销转化和 C 端体验,打开了新的想象空间;二是内容新突破,得益于文心 4.5T 的升级,通过深度训练,使数字人做到了“懂创作”,带货时塑品专业度更高,数字人可以“有个性”,甚至能“玩梗”,为数字人注入灵魂;三是视觉新突破,这次的罗永浩数字人直播,是业内首个多模态高度融合的数字人应用场景,实现了在直播实时环境下的超长演绎,做到了动作、表情、语调等贴合话术,且稳定可控;四是效果新突破,AI 大脑基于直播间信号灵活控场,数字人可以主动邀评、高频互动,极大提升用户沉浸感;通过多智能体实时调度,在数字人直播间实现了和真人直播间一样的互动玩法,如抽奖、发福袋等;强大的运营场控能力、多样化营销手段,有效提升用户转化。



百度电商商业业务部负责人、数字人创新业务部负责人吴晨霞表示,为了支撑本次罗永浩数字人的突破,慧播星重磅升级了新版本,实现了剧本、动作、声音、脚本、问答、互动等维度的全方位升级。

 

现场,吴晨霞对罗永浩数字人的诞生过程进行了揭秘,其通过罗永浩、朱萧木的海量数据训练生成数字人主播,同时结合商品特性与罗永浩人设量身定制直播剧本,实现了神形音容全模态高度统一,还原了罗永浩、朱萧木的惯性动作、表情等,做到如同真人一样自然。在此基础上,慧播星以大师级的创作能力,生成人物高光片段,复刻罗氏幽默,在直播中能够接梗、玩梗,使得数字人表现力有了真人般的魅力。

 

此外,本次突破技术难题的双人剧本,实现了双数字人的默契配合。最后,慧播星作为业界首家实现「AI 大脑」多智能体调度的产品,实现了灵活场控,并支持一个数字人直播间上线多种玩法,有效提升了用户转化。罗永浩数字人首秀大捷,标志着慧播星产品力迈向全新阶段。



背后“黑科技”:多模协同的数字人技术

开放日上,百度集团副总裁吴甜系统性地介绍了多模协同的数字人技术。百度研制的多模协同的数字人技术,基于文心 4.5T 实现了融合多模规划与深度思考的剧本生成,由剧本驱动数字人多模协同,实现动态决策的实时交互,使数字人的“神、形、音、容、话”达到高度统一。最终呈现出一个具备高表现力,内容吸引人,人-物-场可自由交互的超拟真数字人。



她介绍道,剧本生成技术包含台词生成、多模驱动和动态交互三部分。以罗永浩数字人剧本为例,基于文心大模型 4.5 Turbo 生成的剧本,充分展现了主播的个人特色,具备典型的罗氏幽默风格,并能够实现双人主播的内容协同,动态实现丰富的实时互动。通过文本自控的语音合成大模型,实现高复原的语音合成能力,再结合直播台词及发音人特征,合成风格恰当、自然流畅的声音。

 

为解决罗永浩数字人直播双人声音配合的难点,百度采用对话上下文编码器,将对话历史输入和当前对话进行语音合成的统一推理计算,最终实现流畅、自然的双人对话效果。在数字人形象生成以及驱动方面,通过结合多模态视频理解、跨模态信号生成、视频生成等技术,克服了高可控交互,高精度、长时间一致性保持等难点,实现了高一致性超拟真罗永浩数字人长视频生成。


吴甜表示,百度在今年 4 月发布了最新的文心 4.5 Turbo 和文心 X1 Turbo,罗永浩数字人是基于文心大模型的最佳实践。百度在大模型技术的持续探索和创新,将为用户带来更优质的体验、为行业带来更具创新力的业务模式。

 

会上,平晓黎正式宣布,罗永浩将正式担任百度慧播星首席产品体验官,罗永浩在入驻百度优选进行真人直播带货外,其数字人也将不定期开播、常态化为用户带来更多福利。未来,罗永浩作为超头主播,或吸引更多超头主播加入。罗永浩的数字人作为新一代高说服力数字人的首秀,也引发了用户侧的广泛讨论与行业热议,特别是用户的转化效果媲美真人,意味着用户对于数字人的接受度在被验证。



此外,百度电商还推出两大计划:梦蝶计划将通过流量扶持,超头主播数字人打造、预算扶持,实现百度优选超头主播的数量倍增;繁星计划则将再次追加 10 万个慧播星数字人,投入 1 亿元数字人消费补贴、千万级别的运营扶持,帮助更多的普通人、中小企业开启数字人直播。


据罗永浩所属机构交个朋友代表、公司副总裁吴加录表示,百度的 AI 能力与交个朋友的直播运营经验和供应链资源实现了技术与场景的完美结合,这类“技术+IP”的协同模式也将为行业探索智能化转型提供实践样本。



2025-06-18 15:474121

评论

发布
暂无评论

Spring AOP核心类解析,这是最全的一篇了!!

冰河

spring aop ioc 注解驱动 切面编程

Spring 源码学习 05:BeanDefinition 概念及其实现

程序员小航

spring 源码 源码阅读 BeanDefinition

构师训练营 - 第六周课后练习

joshuamai

什么是KMP算法(详解)

赖猫

c++ Linux KMP

LeetCode题解:51. N 皇后,回溯+哈希表,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

JVM调优不知道怎么回答,阿里总结四大模块,学不会就背过来

996小迁

Java 架构 面试 调优

Spock单元测试框架实战指南一Spock是什么?它和JUnit有什么区别?

Java老k

Java 单元测试 JUnit Mock spock

AOT慈善币系统软件开发|AOT慈善币APP开发

系统开发 现成系统

周小川深度解读:DC/EP和数字人民币e-CNY

CECBC

数字人民币

区块链商品追溯平台开发,区块链防伪追溯系统搭建

13530558032

构师训练营 - 第六周学习总结

joshuamai

自己搭建服务器需要多少钱?

德胜网络-阳

区块链版权应用搭建,区块链版权存证平台开发

13530558032

《穿越数据的迷宫》笔记:第 2章 数据管理的挑战

方志

数据治理

智慧公安扫码一键定位报警系统搭建

t13823115967

智慧公安 智慧公安扫码 一键定位报警系统搭建

面对日益严峻的网络安全问题,CDN可以做什么?

阿里云Edge Plus

架构设计之路-1

5加3彩票

架构师 代码规范

谁能阻止世纪互联星光?2020年第11期北京机房网络质量评测数据排行榜发布

博睿数据

重点人员管控系统开发,可视化数据分析搭建

t13823115967

重点人员管控系统开发 智慧公安 可视化数据分析搭建

区块链电子发票应用落地,区块链电子发票系统开发

13530558032

一万字详解 Redis Cluster Gossip 协议

程序员历小冰

redis 分布式 redis cluster

线程模型Reactor/Proactor的区别

Linux服务器开发

reactor 线程 多线程 Linux服务器开发 Proactor

我理解的信息化、数字化、数智化

boshi

数字化 数据智能 信息化

2020亚马逊“黑五”再次成为亚马逊史上最大的年终全球狂欢

爱极客侠

甲方日常 62

句子

工作 随笔杂谈 日常

当千行万业的轨道,换上智能云网的高铁

脑极体

“黑五”前夜的裁员:无接触配送大趋势为什么都带不动亚马逊无人机?

脑极体

年轻人会用C++实现一种协程吗?

ShenDu_Linux

Linux 程序员 多线程 协程 什么是多线程

《穿越数据的迷宫》笔记:第 3 章 DAMA的数据管理原则

方志

数据治理

极客大学 - 架构师训练营 第十一周总结

9527

江西吉安:一个上了区块链柚子的真情告白

CECBC

区块链 蜜柚

罗永浩数字人带货赚了5500万!百度首度公开4项技术突破,将砸1亿再造10万数字人主播_AI&大模型_华卫_InfoQ精选文章