阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

大模型竞争突然升级!亚马逊 CEO 亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型

  • 2023-08-02
    北京
  • 本文字数:2765 字

    阅读完需:约 9 分钟

大模型竞争突然升级!亚马逊CEO亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型

亚马逊“最具野心”的大语言模型,将会是什么样?

亚马逊被曝组建新团队研发大语言模型

 

据外媒 Insider 近日报道,亚马逊 CEO Andy Jassy 目前正直接领导一支新团队,负责开发该公司最具野心的 AI 项目。

 

Jassy 告知亚马逊的 S-team(由 20 多名高管组成的亚马逊最高决策团队),他将提拔 Alexa 首席科学家兼高级副总裁 Rohit Prasad 作为自己的直接下属,向他直接汇报。目前 Jassy 共有 16 名直接下属,包括 Devices and Services 高级副总裁 Dave Limp、零售业务负责人 Doug Herrington、云计算 CEO Adam Selipsky 以及 CFO Brian Olsavsky 等。

 

根据 Insider 获得的一封内部邮件,Prasad 将在新位置上组织建立新的技术小组,致力于为亚马逊打造“最具野心”的大语言模型。

 

大语言模型是 AI 工具中的底层技术,能够从巨大的训练数据集中学会生成与人类相似的响应结果。OpenAI、谷歌和 Meta 等企业都已建立起规模庞大、功能强劲的大语言模型,并在全球范围起掀起热潮。亚马逊之前也有相关布局,成果包括 Alexa Techer Model 和 Titan。

 

在 6 月末发出的这封邮件中,Jassy 称 Prasad 将领导一支“中央小组”,负责构建亚马逊“最具泛用性”的大语言模型。

 

“简单说一下,Prasad 将调任新岗位,负责领导一支中央小组并构建我们最具泛用性的大语言模型。虽然我们已经在公司内部构建起多个大语言模型,还有另外几个项目也在推进,但这次我们将集中优势资源打造最具野心的大语言模型,并由 Prasad 领导这支队伍。在新岗位上,Prasad 将向我直接报告。”

 

资料显示,Prasad 统领 Alexa 团队已经超过十年,同时他也是 Dave Limp 领导的亚马逊 Devices and Services 团队中的一员,并将继续承担这方面工作。

 

根据 Insider 看到的另一封邮件,就在 Jassy 于 6 月宣布上述决定后不久,Limp 在团队内部发出通告,称 Prasad 仍将是“Alexa 的关键合作伙伴与支持者,并将在我们的未来业务中发挥重要作用。”这封邮件称,亚马逊 Devices 副总裁 Daniel Rausch 将接掌 Alexa 产品与业务组织,包括各娱乐、合作伙伴参与及跨国团队。

 

Limp 在邮件中强调,“我们在 Alexa 的使命和愿景上没有动摇,对于我们向客户交付新发明、新成果的能力,我也比以往任何时候都更加乐观。”有消息显示,亚马逊最近还启动另一个新项目,希望利用类似 ChatGPT 的技术让 Alexa 变得更智能、更富个性化。

 

目前关于 Prasad 领导的新团队并未有更多消息流出,但可以看到,亚马逊在这场大模型竞赛中已经准备好了,至于未来能带来什么样的惊喜,还需要交给时间。

亚马逊入局“大模型之战”

 

根据 Insider 之前的报道,亚马逊正急于应对生成式 AI 的迅速崛起。尽管亚马逊过去数十年间一直致力于 AI 技术研究,但微软、OpenAI 和谷歌等竞争对手明显取得了一定优势,Meta 最新的 Llama 2 模型也在整个科技行业内掀起了波澜。为此,亚马逊决定在新计划中立足亚马逊云科技事业部组建新团队,专注于帮助客户使用生成式 AI 产品。

亚马逊的 AI 产品布局

 

在这场大模型竞赛中,亚马逊云科技已经交出过不少答卷。今年 4 月,亚马逊推出了 Amazon Bedrock 服务、Amazon Titan 大语言模型,以及 AI 编码助手 Amazon CodeWhisperer。

 

其中,Amazon Bedrock 既提供自研的大语言基础模型—— Amazon Titan Text 、Amazon Titan Embeddings,也与 AI21 Labs、Anthropic、Stability AI 等基础模型提供商广泛合作,助力企业轻松灵活构建生成式 AI 应用,降低所有开发者的使用门槛。

 

Andy Jassy 在此前接受 CNBC 采访时表示,“大多数企业都想要用上大语言模型,但顶尖 AI 模型需要几十亿美元和长达数年的训练成本和周期,用户肯定不想亲自动手。因此,他们希望能在规模够大、性能更好的基础模型之上工作,再根据自身需求对其做出定制。而这,就是 Bedrock 的基本定位。”

 

Amazon Titan 基础模型可以识别和删除客户提交给定制模型的数据中的有害内容,拒绝用户输入不当内容,过滤模型中不当内容的输出结果。Titan 系列模型分为两种,一种是用于内容生成的文本模型,另一种是可创建矢量嵌入的嵌入模型,用于创建高效搜索功能等。

 

AI 模型经常会出现“一本正经地胡说八道”现象,尽管输出内容看似有理有据、令人信服,但实际上并没有相关训练数据可以支撑。针对 AI “幻觉”问题,亚马逊云科技副总裁 Bratin Saha 此前在接受外媒采访时表示,亚马逊非常关心准确性,并努力确保 Titan 模型能够生成高质量的响应结果。

 

据外媒报道,十几年前起就一直在亚马逊工作的 Sivasubramanian 表示,亚马逊在 AI 领域已经持续投入二十多年,亚马逊云科技目前拥有超过 10 万家 AI 相关客户。他同时补充称,亚马逊也一直在使用 Titan 的微调版本交付主页上的搜索结果。

 

Amazon CodeWhisperer 则是一款面向个人开发者免费使用的辅助代码编写工具,是一种人工智能代码生成扩展,目标是提高软件开发者的工作效率。CodeWhisperer 可以更快地完成更多工作,避免软件开发人员花费大量时间编写非常简单且无差别的代码,CodeWhisperer 作为 AI 编码伴侣,它能根据开发人员的自然语言评论和集成开发环境 ( IDE ) 中的先前代码实时生成代码建议,从根本上提高开发人员的工作效率。

“大型语言模型和生成式 AI 对亚马逊意义重大”

 

在发布上述 AI 服务/产品的同一天,亚马逊还发布了 2022 年度股东信,Jassy 在信中提到,公司正大力投资大型语言模型和生成式 AI。

 

Jassy 表示,LLM 和生成式 AI 是能让“亚马逊未来几十年可以在每个业务领域都进行创新的核心”,将显著加速亚马逊已经深耕了 25 年的机器学习的应用,他称生成式 AI 具有变革性,对客户、股东和亚马逊来说都意义重大:

 

“亚马逊研发自己的 LLM 已有一段时间了,相信它将改变并改善几乎每一种客户体验,并将继续在所有我们的消费者、卖家、品牌和创作者体验中大量投资这些模型。

 

与多年来亚马逊云科技的发展路径一样,我们正在推动各种规模的公司都可以利用生成式人工智能。亚马逊云科技提供了最具性价比的机器学习芯片 Trainium 和 Inferentia,使得小型和大型公司都可以负担得起在生产中训练和运行他们的 LLMs。

 

亚马逊的商业客户可以从各种 LLMs 中进行选择,并使用客户喜好的所有 AWS 安全、隐私和其他功能构建应用程序。此外,我们正在提供像 AWS CodeWhisperer 这样的应用程序,它通过实时生成代码建议来革命性地提高开发者的生产力。”

 

Jassy 最后提到,他本可以用生成式人工智能写一整封信,但他要把这封信留到未来。大型语言模型和生成式人工智能对客户、股东和亚马逊来说都将是一件大事。

 

参考链接:

https://www.businessinsider.com/amazon-ceo-andy-jassy-oversees-group-most-ambitious-ai-models-2023-7

https://www.infoq.cn/article/j3qbSPiG9Hmapal2exir

https://www.cnbc.com/2023/04/13/aws-launches-bedrock-generative-ai-service-titan-llms.html

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-08-02 15:052810

评论

发布
暂无评论
发现更多内容

CI/CD | 大型企业与开发团队如何进行持续集成与持续发布

龙智—DevSecOps解决方案

持续集成 CI/CD 持续发布

Docker 向全面集成 containerd 又迈进一步

张晓辉

Docker 容器 Containerd

Alibaba最新发布!耗时182天肝出来1028页分布式全栈手册太香了

了不起的程序猿

Java 阿里巴巴 分布式 java程序员

国产操作系统应用小程序化:夯实技术底座,促进生态发展

Speedoooo

小程序 国产操作系统 小程序容器

新零售标杆 SKG 全面拥抱 Serverless,实现敏捷交付

阿里巴巴中间件

阿里云 Serverless 云原生

亚信科技、清华AIR、英特尔成功举办WAIC智能算网与绿色计算论坛

亚信AntDB数据库

数据库 AntDB 国产数据库 AntDB数据库

深度操作系统20.7正式发布!

深度操作系统

国产操作系统 deepin 深度操作系统 深度 deepin20.7

版本管理 | 如何解决SVN的合并冲突与分支问题?

龙智—DevSecOps解决方案

svn 版本管理

我用 极狐 Gitlab issue 来点菜 #JIHULAB 101

朱亚光

JIHULAB 101

数据变更白屏化利器-推送轨迹上线

阿里巴巴云原生

zookeeper 阿里云 开源 微服务 云原生

个推TechDay直播回顾 | 分享基于Flink的实时数仓搭建秘诀 附课件下载

个推

数据湖 实时数仓 flink window 数仓建设 大数据仓库

硅谷名企、国内大厂是如何度量研发效能的?|ONES 研发管理大师课

万事ONES

2022最新BATJ等一线互联网大厂秋招面试题汇总,速刷

程序知音

Java 程序员面试 后端技术 Java面试题 Java面试八股文

【荣耀开发者服务平台—百亿曝光扶持等你来】智慧服务内容接口卡片接入指南

荣耀开发者服务平台

手机 激励 卡片服务 厂商 honor

在Java培训机构中怎么学习?

小谷哥

基于GitLab CI的kubectl镜像配置

白粥

gitlab k8s gitlab ci kubectl

设计模式的艺术 第九章适配器设计模式练习(OA系统需要提供一个加密模块,将用户机密信息(例如口令、邮箱)加密再存储在数据库,系统已经定义好数据库操作类。为了提高开发效率,现需要重用已有的加密算法,这些算法封装在一些由第三方提供的类中,有些甚至没有源代码)

代廉洁

设计模式的艺术

区块链NFT网站开发:NFT数字藏品网站开发

开源直播系统源码

NFT 数字藏品 数字藏品系统

LED屏幕有色差要怎么办?

Dylan

LED显示屏 户外LED显示屏 led显示屏厂家

设计模式的艺术 第二十二章观察者设计模式练习(开发一款实时在线股票软件。该软件需要提供如下功能:当股票购买者所购买的某只股票价格变化幅度达到5%时,系统将自动发送通知(包括新价格)给购买该股票的所有股民。试使用观察者模式设计并实现该系统)

代廉洁

北京哪家WEB前端培训机构比较不错

小谷哥

我们总结了弹性伸缩的五个条件与六个教训

阿里巴巴云原生

阿里云 分布式 云原生 弹性伸缩

上海WEB前端培训机构有什么推荐的

小谷哥

零基础如何参加大数据培训机构?

小谷哥

个推TechDay直播回顾 | 分享基于Flink的实时数仓搭建秘诀

个推

测试管理 | 龙智获得Xray专家认证

龙智—DevSecOps解决方案

Jira插件

GOPS现场 | 对话龙智技术顾问,分享DevOps观察与心得

龙智—DevSecOps解决方案

运维 DevOps工具链

设备健康管理在石化行业的探索与实践

PreMaint

预测性维护 设备健康管理

最后 3 天|报名参加 OpenYurt+EdgeX 挑战赛 ,冲击最高 5 万元奖励!

阿里巴巴云原生

阿里云 云原生 openyurt EdgeX

深圳web前端技术培训学习费用

小谷哥

惠州等保测评机构有几家?电话多少?

行云管家

等保 等级保护 等级测评 惠州

大模型竞争突然升级!亚马逊CEO亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型_生成式 AI_凌敏_InfoQ精选文章