NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

大语言模型席卷大厂,为什么百度能先人一步?

  • 2023-03-07
    北京
  • 本文字数:1068 字

    阅读完需:约 4 分钟

大语言模型席卷大厂,为什么百度能先人一步?

ChatGPT 的破圈爆火,把大语言模型推到风口浪尖,让百度、微软、阿里等互联网大厂纷纷瞄准这一赛道。

 

然而趋于冷静后我们能够发现,大语言模型却是一个非常“烧钱”的项目。据国盛证券报告《ChatGPT 需要多少算力》估算,GPT-3 训练一次的成本约为 140 万美元,对于一些更大的 LLM(大型语言模型),训练成本介于 200 万美元至 1200 万美元之间。由此也就不难理解,大语言模型 并不是一朝一夕就能完成的。算力作为训练的基础条件,如果不具备这一核心因素,做出大语言模型就成为了空谈。

 

那么在国内,谁将成为第一个做出大语言模型的科技大厂呢?近日,百度宣布将在 3 月 16 日围绕其生成式 AI 产品、大语言模型“文心一言”召开新闻发布会,成为全球第一个明确大语言模型产品落地时间的科技公司。

 

实际上,百度能在这波 ChatGPT 的热潮下抢占头筹也并不意外。百度深耕人工智能领域十余年,拥有芯片、框架、模型和应用四层技术栈。基于长期技术投入,百度基础能力完全具备、具有综合优势,不仅能够实现整体持平 ChatGPT,甚至还有机会做到局部超越,超越部分包括知识增强、检索增强和对话增强。

 

知识增强方面,百度文心大模型是全球首个知识增强千亿大模型,拥有世界上最大规模知识图谱,包含 50 亿实体、5500 亿级事实,每天调用量超过 400 亿次。知识图谱是以结构化的形式描述真实世界中的实体、属性、关系等,是机器认知世界的重要基础;检索增强则是指,在大模型底层上,搜索架构和生成式 AI 架构可以融合。搜索在真实数据和用户需求理解上具备先发优势,能提升大语言模型的准确性和实效性。

 

此外,在对话一致性、长期记忆和多轮对话丰富度上,文心一言也可能有更好的表现。百度在这方面实力显著,其“知识与深度学习融合的通用对话技术及应用”曾获中国人工智能协会吴文俊奖特等奖,是历史上首个特等奖;“百度大脑核心技术与开放平台”获中国电子学会科技进步奖一等奖;百度超级智能助手也曾获中国专利金奖。

 

接下来,百度计划将多项主流业务与文心一言整合。李彦宏在财报电话会上提到:“我们相信文心一言将改变云计算的游戏规则,人工智能正在以一种巨大的方式改变许多行业,我们对即将发生的事情感到非常兴奋。”据了解,文心一言将通过百度智能云提供服务,吸引企业和机构客户使用 API 和基础设施,共同搭建 AI 模型、开发应用,实现产业 AI 普惠。目前,已有超 500 家企业宣布加入“文心一言”生态圈。


3 月 16 日 14 点,百度计划在北京总部召开新闻发布会,主题围绕文心一言。百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰将出席。文心一言的率先推出,到底能给行业带来哪些颠覆?让我们拭目以待!


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-03-07 14:483878

评论

发布
暂无评论
发现更多内容

听 GPT 讲 client-go 源代码 (5)

fliter

Java集合篇之深入解析LinkedList

EquatorCoco

Java 前端 开发语言 集合运算

总结

大肚皮狒狒

0-overlay和underlay,这两种容器网络你分得清吗

华为云开发者联盟

容器 开发 华为云 华为云开发者联盟 云容器网络

一文搞懂设计模式—观察者模式

Java随想录

Java 设计模式

Java并发编程基础(上)

FunTester

你的新春照小红书包了!速来定制新春头像,技术让年味更浓

小红书技术REDtech

AI AIGC AI写真

听 GPT 讲 client-go 源代码 (6)

fliter

快速部署MES源码/万界星空科技开源MES

万界星空科技

开源 mes 开源mes 万界星空科技

Spring事务实现原理

京东科技开发者

开放签电子签章2024年第一季度目标

开放签开源电子签章

activiti工作流代码整合流程详解及源码示例-低代码平台

金陵老街

掌上新闻随心播控,HarmonyOS SDK助力新浪新闻打造精致易用的资讯服务新体验

HMS Core

HarmonyOS

solana生态市值机器人

区块链技术

Java Spi是如何找到你的实现的? ——Java SPI原理与实践

骑牛上青山

Java jdk spi

哎呀,当时怎么没有想到 | 京东云技术团队

京东科技开发者

教你用Rust实现Smpp协议

华为云开发者联盟

rust 开发 华为云 华为云开发者联盟 华为云短信服务

vben-admin 配置代理转发

麦兜

MVP实战:再造一个“支付宝”

agnostic

软件架构 MVP 架构设计实战

为企业提供个性化的企业门户解决方案,让团队高效协同

WorkPlus

选择轻量级低代码+定制,轻松打造小程序平台

天津汇柏科技有限公司

低代码开发 小程序开发

VMware Workstation 17安装教程:轻松构建虚拟机

小魏写代码

从API到界面:如何将淘宝/天猫商品详情返回值转化为用户友好的展示

Noah

Canvas库 fabric.js可以实现哪些功能? 动图介绍

秦少卫

开源项目 Fabric.js 图片编辑器 canvas库

WorkPlus助力企业实现无缝沟通与协作的IM平台

WorkPlus

打造安全可靠的阅后即焚聊天平台,保护你的隐私

WorkPlus

糟糕,被SimpleDateFormat坑到啦!| 京东云技术团队

京东科技开发者

开工大吉!秀一下我们假期の战绩

王中阳Go

Java Go 程序人生 面试题 Go 面试题 面经 后端 大厂

教育创新:全国高校软件测试峰会聚焦技术前沿

测吧(北京)科技有限公司

测试

大语言模型席卷大厂,为什么百度能先人一步?_AI&大模型_郑思宇_InfoQ精选文章