写点什么

大模型竞争突然升级!亚马逊 CEO 亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型

  • 2023-08-02
    北京
  • 本文字数:2765 字

    阅读完需:约 9 分钟

大模型竞争突然升级!亚马逊CEO亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型

亚马逊“最具野心”的大语言模型,将会是什么样?

亚马逊被曝组建新团队研发大语言模型

 

据外媒 Insider 近日报道,亚马逊 CEO Andy Jassy 目前正直接领导一支新团队,负责开发该公司最具野心的 AI 项目。

 

Jassy 告知亚马逊的 S-team(由 20 多名高管组成的亚马逊最高决策团队),他将提拔 Alexa 首席科学家兼高级副总裁 Rohit Prasad 作为自己的直接下属,向他直接汇报。目前 Jassy 共有 16 名直接下属,包括 Devices and Services 高级副总裁 Dave Limp、零售业务负责人 Doug Herrington、云计算 CEO Adam Selipsky 以及 CFO Brian Olsavsky 等。

 

根据 Insider 获得的一封内部邮件,Prasad 将在新位置上组织建立新的技术小组,致力于为亚马逊打造“最具野心”的大语言模型。

 

大语言模型是 AI 工具中的底层技术,能够从巨大的训练数据集中学会生成与人类相似的响应结果。OpenAI、谷歌和 Meta 等企业都已建立起规模庞大、功能强劲的大语言模型,并在全球范围起掀起热潮。亚马逊之前也有相关布局,成果包括 Alexa Techer Model 和 Titan。

 

在 6 月末发出的这封邮件中,Jassy 称 Prasad 将领导一支“中央小组”,负责构建亚马逊“最具泛用性”的大语言模型。

 

“简单说一下,Prasad 将调任新岗位,负责领导一支中央小组并构建我们最具泛用性的大语言模型。虽然我们已经在公司内部构建起多个大语言模型,还有另外几个项目也在推进,但这次我们将集中优势资源打造最具野心的大语言模型,并由 Prasad 领导这支队伍。在新岗位上,Prasad 将向我直接报告。”

 

资料显示,Prasad 统领 Alexa 团队已经超过十年,同时他也是 Dave Limp 领导的亚马逊 Devices and Services 团队中的一员,并将继续承担这方面工作。

 

根据 Insider 看到的另一封邮件,就在 Jassy 于 6 月宣布上述决定后不久,Limp 在团队内部发出通告,称 Prasad 仍将是“Alexa 的关键合作伙伴与支持者,并将在我们的未来业务中发挥重要作用。”这封邮件称,亚马逊 Devices 副总裁 Daniel Rausch 将接掌 Alexa 产品与业务组织,包括各娱乐、合作伙伴参与及跨国团队。

 

Limp 在邮件中强调,“我们在 Alexa 的使命和愿景上没有动摇,对于我们向客户交付新发明、新成果的能力,我也比以往任何时候都更加乐观。”有消息显示,亚马逊最近还启动另一个新项目,希望利用类似 ChatGPT 的技术让 Alexa 变得更智能、更富个性化。

 

目前关于 Prasad 领导的新团队并未有更多消息流出,但可以看到,亚马逊在这场大模型竞赛中已经准备好了,至于未来能带来什么样的惊喜,还需要交给时间。

亚马逊入局“大模型之战”

 

根据 Insider 之前的报道,亚马逊正急于应对生成式 AI 的迅速崛起。尽管亚马逊过去数十年间一直致力于 AI 技术研究,但微软、OpenAI 和谷歌等竞争对手明显取得了一定优势,Meta 最新的 Llama 2 模型也在整个科技行业内掀起了波澜。为此,亚马逊决定在新计划中立足亚马逊云科技事业部组建新团队,专注于帮助客户使用生成式 AI 产品。

亚马逊的 AI 产品布局

 

在这场大模型竞赛中,亚马逊云科技已经交出过不少答卷。今年 4 月,亚马逊推出了 Amazon Bedrock 服务、Amazon Titan 大语言模型,以及 AI 编码助手 Amazon CodeWhisperer。

 

其中,Amazon Bedrock 既提供自研的大语言基础模型—— Amazon Titan Text 、Amazon Titan Embeddings,也与 AI21 Labs、Anthropic、Stability AI 等基础模型提供商广泛合作,助力企业轻松灵活构建生成式 AI 应用,降低所有开发者的使用门槛。

 

Andy Jassy 在此前接受 CNBC 采访时表示,“大多数企业都想要用上大语言模型,但顶尖 AI 模型需要几十亿美元和长达数年的训练成本和周期,用户肯定不想亲自动手。因此,他们希望能在规模够大、性能更好的基础模型之上工作,再根据自身需求对其做出定制。而这,就是 Bedrock 的基本定位。”

 

Amazon Titan 基础模型可以识别和删除客户提交给定制模型的数据中的有害内容,拒绝用户输入不当内容,过滤模型中不当内容的输出结果。Titan 系列模型分为两种,一种是用于内容生成的文本模型,另一种是可创建矢量嵌入的嵌入模型,用于创建高效搜索功能等。

 

AI 模型经常会出现“一本正经地胡说八道”现象,尽管输出内容看似有理有据、令人信服,但实际上并没有相关训练数据可以支撑。针对 AI “幻觉”问题,亚马逊云科技副总裁 Bratin Saha 此前在接受外媒采访时表示,亚马逊非常关心准确性,并努力确保 Titan 模型能够生成高质量的响应结果。

 

据外媒报道,十几年前起就一直在亚马逊工作的 Sivasubramanian 表示,亚马逊在 AI 领域已经持续投入二十多年,亚马逊云科技目前拥有超过 10 万家 AI 相关客户。他同时补充称,亚马逊也一直在使用 Titan 的微调版本交付主页上的搜索结果。

 

Amazon CodeWhisperer 则是一款面向个人开发者免费使用的辅助代码编写工具,是一种人工智能代码生成扩展,目标是提高软件开发者的工作效率。CodeWhisperer 可以更快地完成更多工作,避免软件开发人员花费大量时间编写非常简单且无差别的代码,CodeWhisperer 作为 AI 编码伴侣,它能根据开发人员的自然语言评论和集成开发环境 ( IDE ) 中的先前代码实时生成代码建议,从根本上提高开发人员的工作效率。

“大型语言模型和生成式 AI 对亚马逊意义重大”

 

在发布上述 AI 服务/产品的同一天,亚马逊还发布了 2022 年度股东信,Jassy 在信中提到,公司正大力投资大型语言模型和生成式 AI。

 

Jassy 表示,LLM 和生成式 AI 是能让“亚马逊未来几十年可以在每个业务领域都进行创新的核心”,将显著加速亚马逊已经深耕了 25 年的机器学习的应用,他称生成式 AI 具有变革性,对客户、股东和亚马逊来说都意义重大:

 

“亚马逊研发自己的 LLM 已有一段时间了,相信它将改变并改善几乎每一种客户体验,并将继续在所有我们的消费者、卖家、品牌和创作者体验中大量投资这些模型。

 

与多年来亚马逊云科技的发展路径一样,我们正在推动各种规模的公司都可以利用生成式人工智能。亚马逊云科技提供了最具性价比的机器学习芯片 Trainium 和 Inferentia,使得小型和大型公司都可以负担得起在生产中训练和运行他们的 LLMs。

 

亚马逊的商业客户可以从各种 LLMs 中进行选择,并使用客户喜好的所有 AWS 安全、隐私和其他功能构建应用程序。此外,我们正在提供像 AWS CodeWhisperer 这样的应用程序,它通过实时生成代码建议来革命性地提高开发者的生产力。”

 

Jassy 最后提到,他本可以用生成式人工智能写一整封信,但他要把这封信留到未来。大型语言模型和生成式人工智能对客户、股东和亚马逊来说都将是一件大事。

 

参考链接:

https://www.businessinsider.com/amazon-ceo-andy-jassy-oversees-group-most-ambitious-ai-models-2023-7

https://www.infoq.cn/article/j3qbSPiG9Hmapal2exir

https://www.cnbc.com/2023/04/13/aws-launches-bedrock-generative-ai-service-titan-llms.html

2023-08-02 15:054254

评论

发布
暂无评论
发现更多内容

分布式数据库有哪几种

悦数图数据库

图数据库

美国站群服务器租用攻略:选择稳定高效的多站点管理服务

一只扑棱蛾子

站群服务器

碳课堂|如何开展碳排放核算? ISO 14064-2 项目层次要点解读

AMT企源

双碳 碳管理 碳排放

【活动】5 月 18 日,@每一个对开源数字经济感兴趣的你!

Apache IoTDB

浅析MySQL代价模型:告别盲目使用EXPLAIN,提前预知索引优化策略

京东零售技术

后端 MySQL、

一键自动化博客发布工具,用过的人都说好(阿里云篇)

程序那些事

工具 程序那些事 自动发布

【论文速读】|针对模糊驱动生成的提示性模糊测试

云起无垠

活动预告 | 5月16日 Streaming Lakehouse Meetup · Online 与你相约!

Apache Flink

大数据 flink

ETL工具中JSON格式的转换方式

谷云科技RestCloud

json 数据处理 ETL

大模型驱动的新一代 BI 平台,Sugar BI 开启智慧决策新模式

Baidu AICLOUD

大数据 BI

IT外包能在企业上云时提供什么帮助?

Ogcloud

IT IT外包 IT外包公司 IT外包服务 IT外包服务商

Kafka 业务日志采集最佳实践

观测云

kafka 日志分析

「活动预告」PolarDB走进青岛,邀请您一起畅游琴岛山海春韵,共话数据生态创新

阿里云数据库开源

数据库 阿里云 开源 Polar polarDB

海外市场成 ISV 新掘金地?生成式 AI 如何加速业务创新实践?Zilliz 有话说

Zilliz

AWS 大模型 Zilliz LLM

联发科发布天玑AI开发套件,为开发者提供“快、全、强、易”专业开发体验

科技范儿

智能商品计划系统:引领未来零售业的革新之路

第七在线

京东按关键字搜索商品API(jd.item_search)返回值全面解析

技术冰糖葫芦

API 编排 API 文档 API 策略 pinduoduo API

依赖Windows环境的CAD/CAE/CAM等软件如何在信创环境下过渡使用?

点量实时云渲染

信创 云桌面 云渲染 实时云渲染 国产信创

@Async异步失效的9种场景

不在线第一只蜗牛

Java JVM 异步 开发语言

华为云开发者桌面全新发布CodeArts IDE for Python,极致优雅云原生开发体验

ide 软件开发 华为云

低代码与云原生的技术解析:赋能企业数字化转型

不在线第一只蜗牛

云原生 低代码

大模型和传统ai的区别

悦数图数据库

OpenAPI 4 版本推出后会带来怎样的行业变革?

幂简集成

API OpenAPI

程序员必备的7大神器,效率飞起!

秃头小帅oi

SD-WAN实现全球应用加速

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

大模型竞争突然升级!亚马逊CEO亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型_生成式 AI_凌敏_InfoQ精选文章