写点什么

大语言模型席卷大厂,为什么百度能先人一步?

  • 2023-03-07
    北京
  • 本文字数:1068 字

    阅读完需:约 4 分钟

大语言模型席卷大厂,为什么百度能先人一步?

ChatGPT 的破圈爆火,把大语言模型推到风口浪尖,让百度、微软、阿里等互联网大厂纷纷瞄准这一赛道。

 

然而趋于冷静后我们能够发现,大语言模型却是一个非常“烧钱”的项目。据国盛证券报告《ChatGPT 需要多少算力》估算,GPT-3 训练一次的成本约为 140 万美元,对于一些更大的 LLM(大型语言模型),训练成本介于 200 万美元至 1200 万美元之间。由此也就不难理解,大语言模型 并不是一朝一夕就能完成的。算力作为训练的基础条件,如果不具备这一核心因素,做出大语言模型就成为了空谈。

 

那么在国内,谁将成为第一个做出大语言模型的科技大厂呢?近日,百度宣布将在 3 月 16 日围绕其生成式 AI 产品、大语言模型“文心一言”召开新闻发布会,成为全球第一个明确大语言模型产品落地时间的科技公司。

 

实际上,百度能在这波 ChatGPT 的热潮下抢占头筹也并不意外。百度深耕人工智能领域十余年,拥有芯片、框架、模型和应用四层技术栈。基于长期技术投入,百度基础能力完全具备、具有综合优势,不仅能够实现整体持平 ChatGPT,甚至还有机会做到局部超越,超越部分包括知识增强、检索增强和对话增强。

 

知识增强方面,百度文心大模型是全球首个知识增强千亿大模型,拥有世界上最大规模知识图谱,包含 50 亿实体、5500 亿级事实,每天调用量超过 400 亿次。知识图谱是以结构化的形式描述真实世界中的实体、属性、关系等,是机器认知世界的重要基础;检索增强则是指,在大模型底层上,搜索架构和生成式 AI 架构可以融合。搜索在真实数据和用户需求理解上具备先发优势,能提升大语言模型的准确性和实效性。

 

此外,在对话一致性、长期记忆和多轮对话丰富度上,文心一言也可能有更好的表现。百度在这方面实力显著,其“知识与深度学习融合的通用对话技术及应用”曾获中国人工智能协会吴文俊奖特等奖,是历史上首个特等奖;“百度大脑核心技术与开放平台”获中国电子学会科技进步奖一等奖;百度超级智能助手也曾获中国专利金奖。

 

接下来,百度计划将多项主流业务与文心一言整合。李彦宏在财报电话会上提到:“我们相信文心一言将改变云计算的游戏规则,人工智能正在以一种巨大的方式改变许多行业,我们对即将发生的事情感到非常兴奋。”据了解,文心一言将通过百度智能云提供服务,吸引企业和机构客户使用 API 和基础设施,共同搭建 AI 模型、开发应用,实现产业 AI 普惠。目前,已有超 500 家企业宣布加入“文心一言”生态圈。


3 月 16 日 14 点,百度计划在北京总部召开新闻发布会,主题围绕文心一言。百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰将出席。文心一言的率先推出,到底能给行业带来哪些颠覆?让我们拭目以待!


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-03-07 14:483873

评论

发布
暂无评论
发现更多内容

手把手教你,从零开始搭建Spring Cloud Alibaba!这份笔记太牛了

Java你猿哥

spring Spring Cloud ssm 架构师

Spring Cloud微服务网关Zuul过滤链和整合OAuth2+JWT入门实战

做梦都在改BUG

Java Spring Cloud OAuth2 JWT Zuul

一次goroutine 泄漏排查案例

蓝胖子的编程梦

golang 性能 协程 pprof 线上故障

低代码是什么意思

优秀

低代码

selenium源码通读·5 |webdriver/common/action_chains.py-ActionChains类分析

Python 源码 测试 自动化测试 selenium

PC GWP-ASan方案原理 | 堆破坏问题排查实践

字节跳动终端技术

问题排查 PC

GitHub数据库榜单第一:Redis核心原理实践

做梦都在改BUG

Java 数据库 redis 缓存

Nautilus Chain 上首个 DEX PoseiSwap 通证经济学模型解析

股市老人

阿里独家「操作系统和计算机网络」,GitHub标星超百万

做梦都在改BUG

Java 程序员 计算机网络 操作系统

Netty服务开发及性能优化

做梦都在改BUG

Java Netty

OpenTelemetry 正在改变我们跟踪和设计应用的方式

NGINX开源社区

nginx 云原生

一文读懂 Nautilus Chain 上首个 DEX PoseiSwap 的通证经济学

EOSdreamer111

火山引擎DataLeap推出全链路智能监控报警平台

字节跳动数据平台

数据中台 SLA 数据监控 企业号 4 月 PK 榜

Kubernetes 多集群网络方案系列 1 -- Submariner 介绍

Se7en

不同云平台之间的纳管用什么工具好?有推荐的吗?

行云管家

云计算 云平台

Maya 2024中文特别版 适用于Apple M和 intel/win系统

魔仙苹果mac堡

maya破解版 maya2024

轻松几秒提升视频清晰度:Perfectly Clear Video Mac版

真大的脸盆

Mac 视频处理 视频增强 Mac 软件 视频画质

一次系统延迟性优化案例

蓝胖子的编程梦

golang 性能 延迟 线上事故 线上故障

重磅官宣,OpenHarmony开发者大会来了!

OpenHarmony开发者

OpenHarmony

从零学习SDK(5)SDK文档的学习和参考

MobTech袤博科技

阿里内部热捧“Spring全线笔记”,不止是全家桶,太完整了

Java你猿哥

spring Spring Cloud Spring Boot Spring MVC

软件测试如何自我提升

FunTester

软件测试/测试开发丨Pytest 结合 Allure 生成测试报告

测试人

软件测试 自动化测试 测试开发 pytest Allure

Mac电脑照片编辑修图软件精选 每一款各有千秋!

魔仙苹果mac堡

Mac软件 图片编辑 抠图软件 苹果软件资源

商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此

Openlab_cosmoplat

开源社区 ChatGPT

深度剖析Redis九种数据结构实现原理

做梦都在改BUG

Java 数据库 redis 缓存

三维设计新帮手|Blender怎么入门?

Finovy Cloud

blender 3D软件

一站式指标平台 Kyligence Zen 功能详解

Kyligence

数据分析 指标平台

mysql invalid conn排查

蓝胖子的编程梦

MySQL 性能 线上故障 超时 连接池

首次解密小红书“种草”机制:大规模深度学习系统技术是如何应用的

小红书技术REDtech

深度学习 机制策略 活动回顾

程序员如何打破需求魔咒:为什么人越招越多,活越干越累?

小红书技术REDtech

算法 活动回顾

大语言模型席卷大厂,为什么百度能先人一步?_AI&大模型_郑思宇_InfoQ精选文章