阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

深度剖析 Amazon AI 技术应用和战略布局:Alexa 不受重视反逆袭

  • 2019-01-25
  • 本文字数:4083 字

    阅读完需:约 13 分钟

深度剖析Amazon AI技术应用和战略布局:Alexa不受重视反逆袭

本文授权转载自微信公众号“亨利的 TwoCents”,如需转载请联系原作者。



Jeff Bezos 一直有个非常著名的“Day 1”哲学,就是让公司永远保持在一个"Day 1"的状态,他认为一旦到了“Day 2”,就意味着进入停滞期。那如何保持“Day 1”?Jeff 在 2017 年给股东的公开信中提到了 4 个策略:用户至上(Amazon 内部神一般的教条)、抵制形式主义、关注外部趋势和快速决策。


Jeff 早在 1997 年 Amazon 还刚起步的时候就提到“Day1”,当时的 vision:But this is Day 1 for the Internet and,if we execute well for Amazon.com. Today, online commerce saves customers money and precious time. Tomorrow,through personalization online commerce well accelerate the very process of discovery。Amazon 从网上书店起步,Jeff 很早就已经预测到技术对驱动业务发展的重要性——1998 年推出的协同过滤推荐引擎充分体验了这一点。


这就是 Amazon 为什么在“Day1”就对机器学习和人工智能非常重视,从面向消费者的语音助手 Alexa,showcase 的无人商店 Amazon Go,到藏在电商王国背后的 AI 技术,从 inside 到 outside,从 topdown 到 bottomup,AI 渗透进了 Amazon 内部每一个细胞。



相对其他巨头,Amazon 在 AI 领域的收购稍显保守,但 Amazon Alexa 基金就非常 aggressive,后面会作介绍。2013 年,Amazon 收购了英国公司 Evi Technology,该公司当时开发了一款跟 Siri 类似的语音助手 Evi。据了解,Amazon Echo 的语音技术就来自于 Evi。


2016 年,Amazon 收购了做图像识别的华人初创公司 Orbeus,这是目前 AWS 上提供计算视觉服务 Rekognition 的前身。同年 9 月,收购聊天机器人平台Angel.ai,显然是为 Alexa 布局。2017 年,收购AI云服务安全公司Harvest.ai,就是目前 AWS 推出的支持 ML 技术的安全服务 Macie。



Amazon 的 AI 应用可分为三大类,一类是能“看得见、摸得着”的前沿技术 moonshot 产品,像 Alexa、 Amazon Go 和无人机 Prime Air;一类是“不可见、藏在后台”的 AI 技术,如推荐引擎、仓库机器人和 fulfillment 中心的“最后一公里”;另外就是企业级应用 AWS 云平台,提供 AI 工具和服务,让企业构建自己的 AI 应用。


下面会分为 3 篇文章,全面、深入地剖析 Amazon 的 AI 技术应用和战略布局。




Amazon 在 2004 年成立 Lab126, 专注于硬件产品的研发。实验室曾有 4 个神秘的项目,代号为“ABCD”。拥有 3000 多名研发人员的 Lab126 以 2007 年发布的 Kindle 一战成名。但后来却因重压赌注的智能手机 Fire Phone 的失败而大规模重组,项目 C(据说是 AR 产品)也随之流产。但万万想不到,一直不受重视的项目 D,竟然打了一场漂亮的翻身仗,成为 Amazon 历史上第二个成功的硬件产品。



2014 年,Echo 从 Lab126 孵化出来,先定位 Prime 会员做市场试水,直到 2015 年在美国地区开放给全部用户,接着就一发不可收拾,高歌猛进。凭着快速的语音响应、多场景的语音交互能力、亲民的价格,瞬间秒杀市场上的音箱产品。Echo 从“点”到“面”地铺开战略,从音箱到家电,从家庭到汽车,全面占据消费者的生活场景。Amazon 最新对外公布,部署 Alexa 的设备已经超过 1 亿。虽然一直处于亏损状态,但这并不能阻挡“Alexa Everywhere”的战略。靠硬件盈利并不是 Amazon 的目的,布局才是大棋。这跟当年 AWS“低价切进,闪电式占领市场”的策略如出一辙。AWS 开始 target 中小型企业,财务上一直亏损,但市场渗透极深,等竞争对手开始觉醒的时候,已被 AWS 抛离到很远。另外,Alexa 最大的杀手锏是开放,允许第三方技能集成,吸引了大量开发者进入生态。2018 年,Alexa 技能个数已超 7 万。



这是一个典型的 Alexa 驱动开灯的场景。当用户发起语音指令,就会传给云端的 Alexa 解析和处理。如果 Alexa 发现使用的不是它内置技能,就会去调用外部第三方开发者的技能,最后发出“开灯”的指令。



Alexa 主要通过 2 个核心服务连接开发者和消费者构建生态:AVS (Alexa Voice Service) 和 ASK (Alexa Skill Kit)。


AVS 让设备厂商把 Alexa 的“智能大脑”内嵌进自己开发的设备里,让 Alexa“无处不在”。而 ASK 提供工具和接口给第三方开发者添加定制化的 Alexa 技能,让 Alexa“无所不能”。另外,Amazon 近期还推出连接工具箱 ACK (Alexa Connect Kit) ,允许设备制造商不联网、不走云端、不需开发技能,通过本地连接就可实现设备“智能化”。很明显,Amazon 这些布局极具前瞻性,不但笼络了消费者和开发者,还降低技术门槛让传统的硬件制造商进入生态。它的最终目标是让 Alexa 无处不在、无所不能,统治从家居家电、消费级可穿戴设备到汽车的一切平台。



我们从技术层面 drill down,对 Alexa 的处理流程进行拆解。AVS 主要负责两个转化:语音转文字(Speech-to-Text)和文字转语音(Text-to-Speech)。这两个转化的背后由两个深度学习引擎支撑:Amazon Lex 和 Amazon Polly。


  1. Amazon Lex:语音转文字服务,包含自动语音识别 ASR 和自然语言理解 NLU 的功能,可以独立于 Alexa 使用,是 Amazon AWS 对外提供的 chatbot 服务

  2. Amazon Polly:文字转语音服务,利用的是语音合成技术(speech synthesis)


首先,AVS 解析用户发起的语音请求,识别技能的名称,转成结构化的信息。如果技能已经部署在 AWS,ASK 就直接运行 AWS Lambda 服务。AWS Lambda 是云计算 Serverless 的计算架构,函数即服务(Function-as-a-Service, FaaS)。简单的来说,就是开发人员直接编写运行在云端上的函数,后面 AWS 章节会详细描述。如果技能不在 AWS,ASK 就通过 REST API 调用外部服务。返回的结果通过 AVS 转成语音信息传给 Echo,或者图像形式发送到手机 App。



Alexa 的成功主要在产品、市场先机和开放策略。先从 Echo 单点爆发,迅速占领市场,形成第一道“护城河”。然后,利用开放的策略,吸引更多的开发者研发第三方的 Alexa 设备,满足消费者各种场景需求,用户体验不断提升,然后带来更多的流量,吸引更多的开发者进入,打造一个自给自足的生态循环,形成第二道“护城河”。另外,生态的增长,持续产生大量有价值的用户偏好数据,数据的反哺帮助 ML 算法优化,分析更加精确,个性化程度更高,客户的体验更好,形成第三道“护城河”。从用户流量,到开发生态,到数据反哺,持续优化模型,层层递进,形成一个让竞争对手难以复制的巨大壁垒,最终垄断市场。



Amazon 在 2015 年成立 1 亿美元的 Alexa Fund,2017 年再加注 1 亿美元,target 全球更多地区(美国、加拿大、澳新、印度等)。基金目的主要是围绕 Alexa 打造智能助手的生态,让 Alexa 植入到更多的外部第三方产品,开发更多技能,引入先进的语音交互、NLP 等 AI 技术。基金除了关注 ToC 应用,还会进入 ToB 领域,这跟逐渐从消费级转型到企业级的微软 Cortana 正面交锋。


除了基金,Alexa 跟知名加速器 Techstars 合作,孵化以语音技术驱动的创业公司。据了解,Amazon 与 Techstars 向每家加速器创业公司投资 12 万美元,换取 6%的普通股。另外,基金还与大学,如卡内基梅隆 CMU、Johns Hopkins、南加州大学以及加拿大的 Waterloo 等,合作创办 fellowship 项目,争取从更早期阶段孵化语音 AI 技术。



基金的 portfolio 有 3 家来自加拿大,7 家来自欧洲,1 家来自以色列和 1 家来自印度,其他均来自美国地区。领域覆盖了智能家居、汽车出行、教育、医疗护理、企业应用等领域。很明显,智能家居仍然是 Alexa 的重心,从智能冰箱贴、宠物喂食器到安防摄像头,共投了 14 家。其中智能门锁 Garageio、智能门铃 Ring、安全路由器 Luma、智能洒水系统 Rachio 均被收购。儿童教育也是 Alexa 的关注领域,结合语音技术和 IoT,赋能儿童 STEM 教育。


核心技术和平台方面,KiTT.ai 专注语音唤醒和自然语音交互技术,尤其定制化的热词检测和支持多回合、多平台的语音会话技术,2017 年被百度收购。DefinedCrowd 针对的是语音识别、NLP 和计算视觉方面的数据打标签和训练服务。还有明星公司 Ctrl-Labs,同时获得 GV、Matrix Partners、Peter Thiel 的 Founders Fund 等知名风投的投资,结合计算神经科学、机器学习、生物物理、人机交互等技术,打造新一代的“脑机接口”。


另外,Alexa 也进入 ToB 领域,包括销售场景的Tact.ai、零售场景的 Blutag、餐饮场景的 SeverRooms。



80 到 90 年代,微软的 Windows 一直稳坐 PC 操作系统的王者地位。从 2000 年开始,移动互联网开始崛起。2007 年是一个关键里程碑,Google 推出免费操作系统 Android 和 Apple 发布 iPhone,标志着正式进入移动互联网时代。虽然两家走的路线不一样,一个开放操作系统以应用生态为主,一个封闭走中高端路线,提供极致的用户体验,但并不阻挡 iOS 和 Android 的发展势头,完全占据了用户手机使用的半壁江山。


2015 年,Echo 横空出世,以极快地进入智能家居市场,从点到面地爆发。通过精准的产品定位、闪电式的市场策略、开放的生态以及投资布局,建立极高的竞争壁垒。得用户者得天下,Amazon 目标只有一个,就是打造下一代基于语音交互的操作系统。



根据“The Alchemy of Growth”理论(中文: 增长的炼金术),企业有三个层次的增长。第一个层次是 Operator,维持当前业务的核心竞争力。第二个层次是 Business Builder,开拓新的业务增长模式和解决方案,扩展核心竞争力。第三层次是最高级别 Visionary,也是离公司的 comfort zone 最远的区域,创造独有的解决方案,开拓全新市场,实现业务爆炸性的增长。


我们可以看出,Echo 一系列智能产品利用语音技术让 Amazon 从电商业务拓展到智能家居,实现了新的业务模式,进入到 Horizon II。盈利不是首要目标,速度才是关键。这让我想到了“The Lean Startup”里面的原则: learning and iterating as quickly as you can to build a viable business。而 Alexa 最大的潜力在于开放 API 给第三方的开发者,打造生态系统,让 Alexa 的设备达到 1 亿多台,一年之内翻了 5 倍,把 Amazon 带进了 Horizon III,实现 transformative 的增长。是否能实现 Amazon 最终的目标?我们拭目以待。


下一篇,将会细讲 Amazon 在电商和物流上的 AI 应用和布局,敬请留意。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-01-25 12:307067

评论

发布
暂无评论
发现更多内容

无聊科技正经事周刊(第6期):纯粹的程序员与必然的中年危机

潘大壮

程序员 周刊 行业趋势 科技周刊

如何清除 WordPress 中的缓存

海拥(haiyong.site)

WordPress 5月月更

我国类脑计算处于什么水平?人工智能下神经科学启发的类脑计算。

蓝海大脑GPU

人工智能 液冷服务器 类脑计算 神经科学

实现同比、环比计算的N种姿势

葡萄城技术团队

数据分析 BI数据分析 同比 环比

玩了一场剧本杀,同车队友“不是人”

脑极体

netty系列之:我有一个可扩展的Enum你要不要看一下?

程序那些事

Java Netty 程序那些事 5月月更

Spring Authorization Server 实现授权中心

Zhang

Java OAuth 2.1 Spring Security OAuth

GPU分类和应用现状分析

Finovy Cloud

人工智能 云计算 gpu GPU服务器

直播预告 | PolarDB-X 动手实践系列——PolarDB-X Replica原理和使用

阿里云数据库开源

数据库 阿里云 开源 PolarDB-X

如何开发 LAXCUS 分布式应用软件(四):编写边缘端软件

LAXCUS分布式操作系统

并行计算 端边云协同架构 分布式操作系统 分布式应用软件

4月月更开奖啦!中奖者速来领取!

InfoQ写作社区官方

热门活动

英特尔公布数据中心和人工智能领域重大进展,全方位展示强劲领导力

科技新消息

蝉联第一!金蝶夺取Gartner中国高生产力aPaaS市场冠军!

金蝶云·苍穹

String源码解析-String的使用注意2

zarmnosaj

5月月更

谁说 Zadig 只能复制环境?数百微服务一套环境实现高效协作

Zadig

DevOps 云原生 CI/CD 软件交付

“四大高手”为你的 Vue 应用程序保驾护航

葡萄城技术团队

钉钉 Flutter 跨四端方案设计与技术实践 | Dutter

阿里巴巴终端技术

flutter 移动端 跨端框架 桌面端

云图说|华为云帮助中心最佳实践:源自项目实战的上云指导

华为云开发者联盟

最佳实践 华为云 云图说 帮助中心 业务上云

在字节跳动,一个更好的企业级SparkSQL Server这么做

字节跳动数据平台

基于 Agora SDK 实现 Windows 端的一对一视频通话(基于3.6.2版本)

声网

人工智能 音视频 sdk

动辄“耗资过亿”的表格工具,究竟难在哪儿?

葡萄城技术团队

如何开发 LAXCUS 分布式应用软件(三):编写终端软件

LAXCUS分布式操作系统

集群架构 并行计算 端边云 分布式操作系统 分布式应用软件

Spring Security

Zhang

Java spring security

墨天轮访谈 | OceanBase 白超:海量数据管理,为什么选择OceanBase?

墨天轮

数据库 oceanbase 国产数据库

英特尔以四大超级技术力量,助力数字未来,发布多项进展

科技新消息

echarts饼图指示器文字颜色设置不同

空城机

eCharts 5月月更

数据标准在网易的实践

网易数帆

大数据 数据仓库 数据治理 元数据 数据标准

揭秘英特尔未来IPU路线图,开启数据中心“进化之旅”

科技新消息

有趣、实用、全面,是程序员心中理想人工智能教材的样子了

图灵教育

深度学习 PyTorch

FinClip+微幕小程序,助力企业全端公私域流量互通

Speedoooo

小程序 WordPress 移动开发 小程序容器

硬件为矛 软件为盾 英特尔分享数据中心GPU的攻守之道

科技新消息

深度剖析Amazon AI技术应用和战略布局:Alexa不受重视反逆袭_AI&大模型_Henry_InfoQ精选文章