【QCon】精华内容上线92%,全面覆盖“人工智能+”的典型案例!>>> 了解详情
写点什么

大语言模型席卷大厂,为什么百度能先人一步?

  • 2023-03-07
    北京
  • 本文字数:1068 字

    阅读完需:约 4 分钟

大语言模型席卷大厂,为什么百度能先人一步?

ChatGPT 的破圈爆火,把大语言模型推到风口浪尖,让百度、微软、阿里等互联网大厂纷纷瞄准这一赛道。

 

然而趋于冷静后我们能够发现,大语言模型却是一个非常“烧钱”的项目。据国盛证券报告《ChatGPT 需要多少算力》估算,GPT-3 训练一次的成本约为 140 万美元,对于一些更大的 LLM(大型语言模型),训练成本介于 200 万美元至 1200 万美元之间。由此也就不难理解,大语言模型 并不是一朝一夕就能完成的。算力作为训练的基础条件,如果不具备这一核心因素,做出大语言模型就成为了空谈。

 

那么在国内,谁将成为第一个做出大语言模型的科技大厂呢?近日,百度宣布将在 3 月 16 日围绕其生成式 AI 产品、大语言模型“文心一言”召开新闻发布会,成为全球第一个明确大语言模型产品落地时间的科技公司。

 

实际上,百度能在这波 ChatGPT 的热潮下抢占头筹也并不意外。百度深耕人工智能领域十余年,拥有芯片、框架、模型和应用四层技术栈。基于长期技术投入,百度基础能力完全具备、具有综合优势,不仅能够实现整体持平 ChatGPT,甚至还有机会做到局部超越,超越部分包括知识增强、检索增强和对话增强。

 

知识增强方面,百度文心大模型是全球首个知识增强千亿大模型,拥有世界上最大规模知识图谱,包含 50 亿实体、5500 亿级事实,每天调用量超过 400 亿次。知识图谱是以结构化的形式描述真实世界中的实体、属性、关系等,是机器认知世界的重要基础;检索增强则是指,在大模型底层上,搜索架构和生成式 AI 架构可以融合。搜索在真实数据和用户需求理解上具备先发优势,能提升大语言模型的准确性和实效性。

 

此外,在对话一致性、长期记忆和多轮对话丰富度上,文心一言也可能有更好的表现。百度在这方面实力显著,其“知识与深度学习融合的通用对话技术及应用”曾获中国人工智能协会吴文俊奖特等奖,是历史上首个特等奖;“百度大脑核心技术与开放平台”获中国电子学会科技进步奖一等奖;百度超级智能助手也曾获中国专利金奖。

 

接下来,百度计划将多项主流业务与文心一言整合。李彦宏在财报电话会上提到:“我们相信文心一言将改变云计算的游戏规则,人工智能正在以一种巨大的方式改变许多行业,我们对即将发生的事情感到非常兴奋。”据了解,文心一言将通过百度智能云提供服务,吸引企业和机构客户使用 API 和基础设施,共同搭建 AI 模型、开发应用,实现产业 AI 普惠。目前,已有超 500 家企业宣布加入“文心一言”生态圈。


3 月 16 日 14 点,百度计划在北京总部召开新闻发布会,主题围绕文心一言。百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰将出席。文心一言的率先推出,到底能给行业带来哪些颠覆?让我们拭目以待!


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2023-03-07 14:483859

评论

发布
暂无评论
发现更多内容

图片与标题的Ken Burns动效

寇云

CSS css3

产业区块链:产业是本质,区块链是工具

CECBC

新基建 CECBC 区块链技术 中国电子

只需CSS的下拉式导航菜单

寇云

CSS css3

平台化服务的基石:权限模型设计

孤岛旭日

企业架构 用户权限 数据建模

毫无意义的人生唯有编织图案

xyz

写给产品经理的信(6):时间管理

punkboy

极客时间,项目管理 职场 产品经理 时间分配 时间管理

不忘初心,继续努力

一周思进

ARTS 打卡计划

Spring源码

云淡风轻

spring 源码

Django ListView DetailView等基于类的视图如何添加装饰器?

BigYoung

Python django LiveView 装饰器

一位测试工程师的自我介绍

姬翔

测试

关于字符编码那些你应该知道的事情

꯭🇫꯭

Java MySQL emoji utf-8 ASCII

SpringBoot之多模块开发

北漂码农有话说

设计模式:建造者设计模式

毛佳伟🐳

大厂为什么不招30岁以上程序员,看这篇就够了

金刚小书童

程序员 职业规划 技术管理 职业成长

谈谈控制感(11):这样提升控制感,谁都能做到

史方远

心理 成长

面试都在问的微服务、服务治理、RPC、下一代微服务框架... 一文带你彻底搞懂!

程序员柠檬

微服务 后台开发 架构设计

Vite for Vue 是什么?

꯭🇫꯭

Vue vuejs vite Vue3

恭喜你,赢得了爱情长跑的胜利

小天同学

爱情 兄弟 祝福

JUC整理笔记四之梳理VarHandle(上)

JFound

Java

广告的发展历程

子悠

广告 计算广告 广告系统 互联网广告 RTB

终于找到了一篇文章!通俗地讲解计算机工作原理

图灵社区

cpu 存储器 编译器 计算机工作原理

贴吧电纸书资深用户,从7个方面详谈BOOX Poke2上手体验!

DT极客

Spring Bean生命周期——初始化和销毁

xiaoxi666

Java spring

如何存储1个二进制位&锁存器的核心和本质

姜海天

计算机 数字逻辑

【CSS】为什么a标签的伪类选择器要注意书写顺序?

德育处主任

CSS html css3 大前端 Web

Cassandra可调一致性的使用及原理

老任物联网杂谈

大数据 分布式 Cassandra 可调一致性

vue-router 容易被忽视的几个地方

꯭🇫꯭

Vue vuejs vue-router router

ARTS-week-1

youngitachi

ARTS 打卡计划 arts

2020年5月30日 泛型程序设计

瑞克与莫迪

Vol.10 Java 25岁了!

pyfn2030

Java jdk 编程语言 Java25周年

python实现·十大排序算法之桶排序(Bucket Sort)

南风以南

Python 排序算法 桶排序

大语言模型席卷大厂,为什么百度能先人一步?_AI&大模型_郑思宇_InfoQ精选文章