【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

大模型竞争突然升级!亚马逊 CEO 亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型

  • 2023-08-02
    北京
  • 本文字数:2765 字

    阅读完需:约 9 分钟

大模型竞争突然升级!亚马逊CEO亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型

亚马逊“最具野心”的大语言模型,将会是什么样?

亚马逊被曝组建新团队研发大语言模型

 

据外媒 Insider 近日报道,亚马逊 CEO Andy Jassy 目前正直接领导一支新团队,负责开发该公司最具野心的 AI 项目。

 

Jassy 告知亚马逊的 S-team(由 20 多名高管组成的亚马逊最高决策团队),他将提拔 Alexa 首席科学家兼高级副总裁 Rohit Prasad 作为自己的直接下属,向他直接汇报。目前 Jassy 共有 16 名直接下属,包括 Devices and Services 高级副总裁 Dave Limp、零售业务负责人 Doug Herrington、云计算 CEO Adam Selipsky 以及 CFO Brian Olsavsky 等。

 

根据 Insider 获得的一封内部邮件,Prasad 将在新位置上组织建立新的技术小组,致力于为亚马逊打造“最具野心”的大语言模型。

 

大语言模型是 AI 工具中的底层技术,能够从巨大的训练数据集中学会生成与人类相似的响应结果。OpenAI、谷歌和 Meta 等企业都已建立起规模庞大、功能强劲的大语言模型,并在全球范围起掀起热潮。亚马逊之前也有相关布局,成果包括 Alexa Techer Model 和 Titan。

 

在 6 月末发出的这封邮件中,Jassy 称 Prasad 将领导一支“中央小组”,负责构建亚马逊“最具泛用性”的大语言模型。

 

“简单说一下,Prasad 将调任新岗位,负责领导一支中央小组并构建我们最具泛用性的大语言模型。虽然我们已经在公司内部构建起多个大语言模型,还有另外几个项目也在推进,但这次我们将集中优势资源打造最具野心的大语言模型,并由 Prasad 领导这支队伍。在新岗位上,Prasad 将向我直接报告。”

 

资料显示,Prasad 统领 Alexa 团队已经超过十年,同时他也是 Dave Limp 领导的亚马逊 Devices and Services 团队中的一员,并将继续承担这方面工作。

 

根据 Insider 看到的另一封邮件,就在 Jassy 于 6 月宣布上述决定后不久,Limp 在团队内部发出通告,称 Prasad 仍将是“Alexa 的关键合作伙伴与支持者,并将在我们的未来业务中发挥重要作用。”这封邮件称,亚马逊 Devices 副总裁 Daniel Rausch 将接掌 Alexa 产品与业务组织,包括各娱乐、合作伙伴参与及跨国团队。

 

Limp 在邮件中强调,“我们在 Alexa 的使命和愿景上没有动摇,对于我们向客户交付新发明、新成果的能力,我也比以往任何时候都更加乐观。”有消息显示,亚马逊最近还启动另一个新项目,希望利用类似 ChatGPT 的技术让 Alexa 变得更智能、更富个性化。

 

目前关于 Prasad 领导的新团队并未有更多消息流出,但可以看到,亚马逊在这场大模型竞赛中已经准备好了,至于未来能带来什么样的惊喜,还需要交给时间。

亚马逊入局“大模型之战”

 

根据 Insider 之前的报道,亚马逊正急于应对生成式 AI 的迅速崛起。尽管亚马逊过去数十年间一直致力于 AI 技术研究,但微软、OpenAI 和谷歌等竞争对手明显取得了一定优势,Meta 最新的 Llama 2 模型也在整个科技行业内掀起了波澜。为此,亚马逊决定在新计划中立足亚马逊云科技事业部组建新团队,专注于帮助客户使用生成式 AI 产品。

亚马逊的 AI 产品布局

 

在这场大模型竞赛中,亚马逊云科技已经交出过不少答卷。今年 4 月,亚马逊推出了 Amazon Bedrock 服务、Amazon Titan 大语言模型,以及 AI 编码助手 Amazon CodeWhisperer。

 

其中,Amazon Bedrock 既提供自研的大语言基础模型—— Amazon Titan Text 、Amazon Titan Embeddings,也与 AI21 Labs、Anthropic、Stability AI 等基础模型提供商广泛合作,助力企业轻松灵活构建生成式 AI 应用,降低所有开发者的使用门槛。

 

Andy Jassy 在此前接受 CNBC 采访时表示,“大多数企业都想要用上大语言模型,但顶尖 AI 模型需要几十亿美元和长达数年的训练成本和周期,用户肯定不想亲自动手。因此,他们希望能在规模够大、性能更好的基础模型之上工作,再根据自身需求对其做出定制。而这,就是 Bedrock 的基本定位。”

 

Amazon Titan 基础模型可以识别和删除客户提交给定制模型的数据中的有害内容,拒绝用户输入不当内容,过滤模型中不当内容的输出结果。Titan 系列模型分为两种,一种是用于内容生成的文本模型,另一种是可创建矢量嵌入的嵌入模型,用于创建高效搜索功能等。

 

AI 模型经常会出现“一本正经地胡说八道”现象,尽管输出内容看似有理有据、令人信服,但实际上并没有相关训练数据可以支撑。针对 AI “幻觉”问题,亚马逊云科技副总裁 Bratin Saha 此前在接受外媒采访时表示,亚马逊非常关心准确性,并努力确保 Titan 模型能够生成高质量的响应结果。

 

据外媒报道,十几年前起就一直在亚马逊工作的 Sivasubramanian 表示,亚马逊在 AI 领域已经持续投入二十多年,亚马逊云科技目前拥有超过 10 万家 AI 相关客户。他同时补充称,亚马逊也一直在使用 Titan 的微调版本交付主页上的搜索结果。

 

Amazon CodeWhisperer 则是一款面向个人开发者免费使用的辅助代码编写工具,是一种人工智能代码生成扩展,目标是提高软件开发者的工作效率。CodeWhisperer 可以更快地完成更多工作,避免软件开发人员花费大量时间编写非常简单且无差别的代码,CodeWhisperer 作为 AI 编码伴侣,它能根据开发人员的自然语言评论和集成开发环境 ( IDE ) 中的先前代码实时生成代码建议,从根本上提高开发人员的工作效率。

“大型语言模型和生成式 AI 对亚马逊意义重大”

 

在发布上述 AI 服务/产品的同一天,亚马逊还发布了 2022 年度股东信,Jassy 在信中提到,公司正大力投资大型语言模型和生成式 AI。

 

Jassy 表示,LLM 和生成式 AI 是能让“亚马逊未来几十年可以在每个业务领域都进行创新的核心”,将显著加速亚马逊已经深耕了 25 年的机器学习的应用,他称生成式 AI 具有变革性,对客户、股东和亚马逊来说都意义重大:

 

“亚马逊研发自己的 LLM 已有一段时间了,相信它将改变并改善几乎每一种客户体验,并将继续在所有我们的消费者、卖家、品牌和创作者体验中大量投资这些模型。

 

与多年来亚马逊云科技的发展路径一样,我们正在推动各种规模的公司都可以利用生成式人工智能。亚马逊云科技提供了最具性价比的机器学习芯片 Trainium 和 Inferentia,使得小型和大型公司都可以负担得起在生产中训练和运行他们的 LLMs。

 

亚马逊的商业客户可以从各种 LLMs 中进行选择,并使用客户喜好的所有 AWS 安全、隐私和其他功能构建应用程序。此外,我们正在提供像 AWS CodeWhisperer 这样的应用程序,它通过实时生成代码建议来革命性地提高开发者的生产力。”

 

Jassy 最后提到,他本可以用生成式人工智能写一整封信,但他要把这封信留到未来。大型语言模型和生成式人工智能对客户、股东和亚马逊来说都将是一件大事。

 

参考链接:

https://www.businessinsider.com/amazon-ceo-andy-jassy-oversees-group-most-ambitious-ai-models-2023-7

https://www.infoq.cn/article/j3qbSPiG9Hmapal2exir

https://www.cnbc.com/2023/04/13/aws-launches-bedrock-generative-ai-service-titan-llms.html

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-08-02 15:052822

评论

发布
暂无评论
发现更多内容

第一周作业

沐风

[架构实战营]模块一作业:微信业务架构与学生管理系统

Geek_99eefd

架构实战营 「架构实战营」

022云原生之Kubernetes服务

穿过生命散发芬芳

云原生 10月月更

Android 音视频采集那些事

声网

音视频

JavaScript对象创建的 6 种模式

devpoint

工厂模式 原型链 构造函数 JavaScrip 10月月更

把握数字经济发展趋势和规律 推动我国数字经济健康发展

CECBC

官方线索 | HDC.Together华为开发者大会2021

穿过生命散发芬芳

1024我在现场

ConcurrentHashMap JDK1.8 源码分析

黄敏

java

【新】虚拟机深层系列「GC本质底层机制」SafePoint的深入分析和底层原理探究指南

洛神灬殇

JVM safepoint JVm虚拟机 10月月更

21. 合并两个有序链表(链表)

黄敏

ORM

风翱

ORM 10月月更

docker 系列:实践工具

yuexin_tech

Prometheus 查询操作符(四) 示例合集

耳东@Erdong

Prometheus 10月月更

Go 中如何写注释

baiyutang

golang 10月月更

再次捕获云上在野容器攻击,TeamTNT黑产攻击方法揭秘

腾讯安全云鼎实验室

容器 云安全

百万大数据5期-BSM-01课作业

Clarke

如何应对职场焦虑?

石云升

焦虑 职场经验 10月月更

音视频:播放器与H.265播放探索

程序员架构进阶

视频流 播放器 H.265 10月月更

linux之curl命令

入门小站

Linux

一文读懂公共部门、区块链和数字太空竞赛三者之间的角色关系

CECBC

区块链的监管架构基本成型

CECBC

营销CRM软件(销售管理工具)让客户都成为回头客

低代码小观

营销 企业 企业管理 CRM 管理系统

数字货币交易所系统开发内容(案例)

1万字长文高速你千万级并发架构下如何提高数据库存储性能

Java 编程 架构 面试 分布式

揭秘!探访百度AI反诈第一线

白洞计划

【权限专栏】谁允许你访问了?

趣链科技

区块链 权限管理

通过几个小程式来快速学习Java基本语法 | Java

Regan Yue

Java 10月月更

在线字符串转列表工具

入门小站

工具

Map (映射) 实现

BlockQuant

map 哈希表 hash table

知识计算:华为云要给AI时代开一扇门

脑极体

深空时代来临,探日究竟有何魔力?

脑极体

大模型竞争突然升级!亚马逊CEO亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型_生成式 AI_凌敏_InfoQ精选文章