写点什么

百度 CTO 王海峰拆解 iRAG,称文心大模型仍在持续训练中

  • 2024-11-12
    北京
  • 本文字数:2020 字

    阅读完需:约 7 分钟

大小:722.61K时长:04:06
百度CTO王海峰拆解iRAG,称文心大模型仍在持续训练中

11 月 12 日,在以“应用来了”为主题的百度世界 2024 上,百度首席技术官王海峰在会上宣布文心一言的用户规模已经达到 4.3 亿。此外,王海峰还解读了文心大模型最新技术及应用,如检索增强的文生图、无代码产品秒哒、文心快码等。

大模型搜索增强


据王海峰介绍,在检索增强方面,百度研发了“理解-检索-生成”协同优化的检索增强技术,提升了大模型技术及应用效果;面向不同应用场景的生图需求,进一步研发了检索增强的文生图技术 iRAG,既可以生成精确的图片,也可以进行泛化生图。

 

那么,大模型是如何做到这一点的呢?

 

首先,基于大模型对用户的需求进行分析理解,自动规划精确或泛化方案,比如对哪些实体进行增强;接着在增强阶段,对需要增强的实体,检索并选择相应的参考图。最后在生成阶段,自研了多模可控生图大模型,一方面,通过局部注意力计算,在保持实体特征不变的情况下,实现了图像的高泛化生成,比如根据牛顿的肖像生成绘本风格的牛顿;另一方面,通过整体注意力计算,进行高精确的图像生成,比如生成图中的汽车跟原图片保持完全一致。在实际应用中,这个方法也支持用户上传参考图,应用户期望进行生成。

 

王海峰还笃定地透露,文心大模型仍在持续训练中,更强大的新版本值得期待。

 

多智能体应用

 

早在去年 10 月,百度就发布了智能体机制,并研制了系统 2。其核心是思考模型,包括理解、规划、反思和进化,能够做到可靠执行、自我进化,并在一定程度上将思考过程白盒化,从而让机器像人一样思考和行动,自主完成复杂任务,同时在环境中持续学习、自主进化。

 

人类社会中,一个人掌握的知识和技能终归是有限的。为了完成更加复杂的任务或项目,需要团队协作。同样,智能体为了完成复杂任务,也需要多智能体的协作,比如中心化、去中心化和流水线等模式。多智能体的协作可以有效增强智能系统的整体效能,提升解决复杂问题的能力。

 

王海峰分享了多智能体在代码场景里的应用——秒哒和文心快码。秒哒采用了智能体的中心化模式,其中的代码智能体通过场景知识的增强,提升了复杂代码生成的质量与稳定性,高效实现用户需要的功能。智能代码助手文心快码升级至 3.0 版本,现场王海峰进一步演示了文心快码完成系统的功能开发、代码测试和问题修复等能力。在开发全流程中,多个智能体流水线协同,大幅提升了程序员的工作质量和效率。



面向产业需求,百度打造了文心大模型矩阵,包括 ERNIE 4.0 Turbo 等旗舰大模型、ERNIE Speed 等轻量模型,以及基于基础模型生产的系列思考模型和场景模型,满足不同应用的需要。而在这背后,文心大模型和飞桨深度学习平台联合优化、持续创新,提升了模型效果、训练效率和推理性能,支撑了文心大模型的广泛应用。



王海峰现场还披露,飞桨文心开发者数量已达 1808 万,服务了 43 万家企业,创建了 101 万个模型。

 

科技和体育的大模型应用


随着人工智能技术加速进步,AI 在千行百业的应用也越来越深入。在教育科普领域,中国科学技术馆与百度达成战略合作,双方将利用人工智能技术为科普教育注入新活力,赋能智慧科技场馆建设。中国科学技术馆馆长郭哲与王海峰还在现场发布了“科技馆智能体”,助力科普服务触手可及。

 

王海峰介绍,在体育领域,大模型等人工智能技术辅助国家队备战训练,为运动员夺金争银提供科技支撑。智能跳水辅助训练系统采用云、边、端一体化技术,全自动识别、跟踪、采集、分析每一个跳水动作。基于文心大模型,系统还可以对动作实时打分、精准量化分析,制定训练计划,对运动员身体数据进行科学评估和全面管理。

 

据悉,早在 2019 年,百度就和中国国家跳水队开展技术合作,研发智能跳水辅助训练系统,为运动员科学训练提供技术支撑。系统采用云、边、端一体化技术,全自动识别、跟踪、采集、分析每一个跳水动作。从运动员起跳到入水这 1.8 秒的时间,录制高速视频,实时反馈到教练手中的平板上,对运动员的姿势、动作等进行针对性的指导。基于文心大模型,系统还可以对动作实时打分、精准量化分析,制定训练计划,对运动员身体数据进行全面管理和科学评估,助力科学高效训练。



大会现场,全红婵、陈芋汐、曹缘与百度首席技术官王海峰进行了互动,分享了使用百度 AI 技术的亲身体验。全红婵坦言,巴黎周期自己长高、长重了,做动作的感觉和之前不一样,这套系统可以多角度还原动作,同时也能和之前的动作做对比,看看差别在哪,这样可以把动作完成得更好。她直呼这套系统“真是太全面了。”

 

陈芋汐也直言:“除了跳水训练外,日常学习、生活中,也会用文心一言,各种问题都可以问它,出去玩还会用它做攻略!”

 

三位运动员中资历最深的曹缘讲述了他与这套 AI 系统的渊源,他谈道:“我从五年前就开始用 AI 技术训练,能感受到我们的科技力量越来越强大,有了 AI 就像有了‘最强大脑’。”


据悉,除了跳水,文心大模型体育解决方案已经拓展到游泳、攀岩、体操等 6 支国家队的日常训练中。王海峰表示百度将继续积极推动 AI 普惠,研发基于 AI 技术的传统武术、太极拳、八段锦等的智能指导,以科技助力健康中国、体育强国。

2024-11-12 17:235774

评论

发布
暂无评论
发现更多内容

重学JS | ES6既有Set,为啥还要有Weak Set?

梁龙先森

JavaScript 大前端 编程语言 28天写作

Elasticsearch 乐观锁并发控制

escray

elastic 七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试

架构师训练营第四周作业

跳蚤

Spring Boot 中集成Lucence

武哥聊编程

Java springboot SpringBoot 2 28天写作 Lucence

区块链交易所APP开发|区块链交易所系统软件开发

系统开发

产品 0 期 - 第二周作业

Jxin

第九周 性能优化(三)课后作业

简简单单

Mysql 4种方式避免重复插入数据!

xcbeyond

MySQL MySQL使用 28天写作

新荣耀历险记:带着“神装”踏上英雄试炼路

脑极体

一文带你读懂:设计模式的六大原则

后台技术汇

28天写作

「产品经理训练营」第二章作业

Sòrγy_じò ぴé

产品经理训练营 极客大学产品经理训练营 产品训练营

高效学习:如何学得更快更好

石云升

学习 28天写作

数字货币交易所软件开发|数字货币交易所系统APP开发

系统开发

产品经理训练营笔记-产品思维和产品意识(中)

.nil?

产品经理训练营

虚拟币钱包APP系统开发|虚拟币钱包软件开发

系统开发

「架构师训练营 4 期」 第四周 - 001

凯迪

Dockerfile ENV 使用指南

K8sCat

Docker Dockerfile ENV ARG

第九周 学习总结

简简单单

JVM垃圾回收机制是怎样的,何时触发YoungGC或FullGC操作?

Java鱼仔

Java 面试 JVM 垃圾回收

Mac 电脑安装Etcd和Go的etcd/clientv3

BigYoung

Mac etcd client Go 语言

产品经理训练营作业-第二周-产品思维和产品意识

.nil?

产品经理训练营

C++静态链接符号冲突的几种处理方法

ElvinYang

项目管理系列(9)- 项目分析与报告

Ian哥

28天写作

架构师训练营第四周学习总结

跳蚤

Nginx架构赏析

旺旺

nginx 架构 中间件

企业是如何选择技术栈来做离线数仓

大数据老哥

算法:匹配有效的括号,Swift 5中UITest从入门到精通, Swift 5 Viper Template,极客大学产品经理训练营 产品思维和产品意识, John 易筋 ARTS 打卡 Week 36

John(易筋)

ARTS 打卡计划 极客大学产品经理训练营 Swift 5 UITest Swift 5 Viper Template

HASH碰撞问题一直没真正搞懂?这下不用慌了

架构精进之路

算法 hash 七日更 28天写作

“苹果陷阱”无法避免,但我们已经在路上

JiangX

苹果 供应链 28天写作 制造业

一起进阶一起拿高工资!Java开发进阶-log4j2日志脱敏原理分析

看点代码再上班

Java 程序员 log4j 编程开发

第二次作业

秦挺

百度CTO王海峰拆解iRAG,称文心大模型仍在持续训练中_AI&大模型_褚杏娟_InfoQ精选文章