阿里云飞天发布时刻,领先大模型限免,超7000万 tokens免费体验 了解详情
写点什么

罗永浩数字人带货赚了 5500 万!百度首度公开 4 项技术突破,将砸 1 亿再造 10 万数字人主播

  • 2025-06-18
    北京
  • 本文字数:2083 字

    阅读完需:约 7 分钟

大小:1.04M时长:06:02
罗永浩数字人带货赚了5500万!百度首度公开4项技术突破,将砸1亿再造10万数字人主播

整理|华卫

 

6 月 17 日,在百度 AI Day 开放日上,百度官宣打造业界首个超头主播罗永浩数字人,并发布了高说服力数字人的四大技术突破。此前,罗永浩数字人直播首秀创下超 1300 万人次观看、GMV 突破 5500 万元的行业新纪录,部分核心品类带货量反超真人直播。

 

“百度的罗永浩数字人已达到媲美超头主播的体感效果,随着大模型与多模能力发展,数字人未来超越真人效果极具潜力。”百度副总裁、电商总经理平晓黎表示,新一代高说服力数字人成为了一个像真人一样,形神音容高度协调、会思考决策、能协作完成特定任务的超级智能体。



数字人生成过程揭秘:4 项新突破

在高说服力数字人的基础之上,百度电商慧播星再一次迭代,围绕慧播星首席体验官罗永浩,发布了业界首个超头主播的数字人,并实现了体验、内容、视觉、效果的四大突破。

 

首先是体验突破,通过复刻罗永浩跟朱萧木的丝滑配合,上线了业界首个双数字人互动直播间,给营销转化和 C 端体验,打开了新的想象空间;二是内容新突破,得益于文心 4.5T 的升级,通过深度训练,使数字人做到了“懂创作”,带货时塑品专业度更高,数字人可以“有个性”,甚至能“玩梗”,为数字人注入灵魂;三是视觉新突破,这次的罗永浩数字人直播,是业内首个多模态高度融合的数字人应用场景,实现了在直播实时环境下的超长演绎,做到了动作、表情、语调等贴合话术,且稳定可控;四是效果新突破,AI 大脑基于直播间信号灵活控场,数字人可以主动邀评、高频互动,极大提升用户沉浸感;通过多智能体实时调度,在数字人直播间实现了和真人直播间一样的互动玩法,如抽奖、发福袋等;强大的运营场控能力、多样化营销手段,有效提升用户转化。



百度电商商业业务部负责人、数字人创新业务部负责人吴晨霞表示,为了支撑本次罗永浩数字人的突破,慧播星重磅升级了新版本,实现了剧本、动作、声音、脚本、问答、互动等维度的全方位升级。

 

现场,吴晨霞对罗永浩数字人的诞生过程进行了揭秘,其通过罗永浩、朱萧木的海量数据训练生成数字人主播,同时结合商品特性与罗永浩人设量身定制直播剧本,实现了神形音容全模态高度统一,还原了罗永浩、朱萧木的惯性动作、表情等,做到如同真人一样自然。在此基础上,慧播星以大师级的创作能力,生成人物高光片段,复刻罗氏幽默,在直播中能够接梗、玩梗,使得数字人表现力有了真人般的魅力。

 

此外,本次突破技术难题的双人剧本,实现了双数字人的默契配合。最后,慧播星作为业界首家实现「AI 大脑」多智能体调度的产品,实现了灵活场控,并支持一个数字人直播间上线多种玩法,有效提升了用户转化。罗永浩数字人首秀大捷,标志着慧播星产品力迈向全新阶段。



背后“黑科技”:多模协同的数字人技术

开放日上,百度集团副总裁吴甜系统性地介绍了多模协同的数字人技术。百度研制的多模协同的数字人技术,基于文心 4.5T 实现了融合多模规划与深度思考的剧本生成,由剧本驱动数字人多模协同,实现动态决策的实时交互,使数字人的“神、形、音、容、话”达到高度统一。最终呈现出一个具备高表现力,内容吸引人,人-物-场可自由交互的超拟真数字人。



她介绍道,剧本生成技术包含台词生成、多模驱动和动态交互三部分。以罗永浩数字人剧本为例,基于文心大模型 4.5 Turbo 生成的剧本,充分展现了主播的个人特色,具备典型的罗氏幽默风格,并能够实现双人主播的内容协同,动态实现丰富的实时互动。通过文本自控的语音合成大模型,实现高复原的语音合成能力,再结合直播台词及发音人特征,合成风格恰当、自然流畅的声音。

 

为解决罗永浩数字人直播双人声音配合的难点,百度采用对话上下文编码器,将对话历史输入和当前对话进行语音合成的统一推理计算,最终实现流畅、自然的双人对话效果。在数字人形象生成以及驱动方面,通过结合多模态视频理解、跨模态信号生成、视频生成等技术,克服了高可控交互,高精度、长时间一致性保持等难点,实现了高一致性超拟真罗永浩数字人长视频生成。


吴甜表示,百度在今年 4 月发布了最新的文心 4.5 Turbo 和文心 X1 Turbo,罗永浩数字人是基于文心大模型的最佳实践。百度在大模型技术的持续探索和创新,将为用户带来更优质的体验、为行业带来更具创新力的业务模式。

 

会上,平晓黎正式宣布,罗永浩将正式担任百度慧播星首席产品体验官,罗永浩在入驻百度优选进行真人直播带货外,其数字人也将不定期开播、常态化为用户带来更多福利。未来,罗永浩作为超头主播,或吸引更多超头主播加入。罗永浩的数字人作为新一代高说服力数字人的首秀,也引发了用户侧的广泛讨论与行业热议,特别是用户的转化效果媲美真人,意味着用户对于数字人的接受度在被验证。



此外,百度电商还推出两大计划:梦蝶计划将通过流量扶持,超头主播数字人打造、预算扶持,实现百度优选超头主播的数量倍增;繁星计划则将再次追加 10 万个慧播星数字人,投入 1 亿元数字人消费补贴、千万级别的运营扶持,帮助更多的普通人、中小企业开启数字人直播。


据罗永浩所属机构交个朋友代表、公司副总裁吴加录表示,百度的 AI 能力与交个朋友的直播运营经验和供应链资源实现了技术与场景的完美结合,这类“技术+IP”的协同模式也将为行业探索智能化转型提供实践样本。



2025-06-18 15:476

评论

发布
暂无评论

嘿!AI 编码新玩法上线!

阿里巴巴云原生

阿里云 AI 云原生

100M 768 维向量数据,Zilliz Cloud 稳定支持 Shulex VOC 业务场景

Zilliz

AI Zilliz 向量数据库 zillizcloud

Java HashMap 和 HashSet 的高效使用技巧

小万哥

Java 程序人生 编程语言 软件工程 后端开发

Libcomm通信库:GaussDB(DWS) 为解决建联过多的小妙招

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 华为云GaussDB(DWS)

印度股票盘开发

GangguHK

10个AI人工智能PPT生成软件,轻松搞定PPT制作!

彭宏豪95

人工智能 在线白板 AIGC 效率软件 AI生成PPT

Easysearch 内核完善之 OOM 内存溢出优化案例一则

极限实验室

elasticsearch OOM 内存 easysearch

度小满轩辕:金融行业的大模型实战派

脑极体

AI

聊聊CWE 4.14 与 ISA/IEC 62443中,如何保障工业软件的安全性

华为云开发者联盟

安全 开发 华为云 华为云开发者联盟 工业软件

跨端轻量JavaScript引擎的实现与探索

京东科技开发者

「2024」不再内卷,让AI低代码带你玩点新花样!

优秀

AI 低代码 AI低代码 AI 人工智能

IO模型介绍(select、poll、epoll)

京东零售技术

Java 后端 io

人工智能的本质是编程+数学吗?

算法的秘密

✅inventory hint,解决热点数据如何高效更新

派大星

:MySQL 数据库 java 编程 热点数据

re:Invent 产品体验与感受分享:Amazon ElastiCache Serverless 缓存的即时扩展

亚马逊云科技 (Amazon Web Services)

Serverless

两会热议高质量发展 华大北斗用芯领航

江湖老铁

你知道h.265吧?但关于AV1编码格式你也来了解一下吗?

Geek_ee6d52

Apache Doris 2.1.0 版本发布:开箱盲测性能大幅优化,复杂查询性能提升 100%

SelectDB

数据库 大数据 查询性能 物化视图 #数据分析

官宣!前联邦快递亚太区董事总经理 Robin 加入 Tapdata 担任首席运营官

tapdata

数据库

业界首份 GitLab DevSecOps 线上成熟度评估邀您来测

极狐GitLab

ChatGPT是什么意思?从产品简介、替代软件到应用场景等全方位解读!

彭宏豪95

人工智能 在线白板 AIGC ChatGPT 效率软件

四种领导风格的大白话理解

芃篙君

管理

【教程】oc代码混淆_OC代码混淆工具

arthas火焰图async-profiler在云交易中的运用

京东科技开发者

从keys命令出发-浅谈redis的字典和字典迭代器

京东科技开发者

罗永浩数字人带货赚了5500万!百度首度公开4项技术突破,将砸1亿再造10万数字人主播_AI&大模型_华卫_InfoQ精选文章