写点什么

亚马逊为它们的语音识别 API 添加了更好粒度的控制

  • 2016-12-11
  • 本文字数:1050 字

    阅读完需:约 3 分钟

亚马逊的语音服务API Alexa 是为亚马逊 Echo 提供支持的NLP(自然语言处理)API。它有一个新的更新,开发人员通过使用语音识别功能API 可以将任何设备转换为“智能”设备。

像微软和谷歌这样的科技巨擘最新发布了几个大规模的NLP,Alexa API 就是其中之一。Alexa 尤其专注于设备和语音识别的集成,这一点和IBM 最近使用它的云平台Bluemix 提供的API 所做的非常相似。Alexa 被设计为一个开发者API,针对希望让不断增长的“物联网”设备市场更加有序的公司。当前智能设备的一个关键问题是它们都存在于不同平台上,具有不同级别的能力和安全性。家里的Hue 灯不知道怎样与八月智能锁通信,这给更高级的可重用的物联网短语带来了障碍。比如“我要出门了”,这样的短语会创建一条自动的命令链来关灯和锁门。苹果的HomeKit 虽然已经取得了长足的进步,使得我们不需要人工地与大量不同用户界面的App 打交道和登录,但是就针对开发的可定制的语音识别API 而言,却收效甚微。HomeKit 是直接与Siri 集成的。

Alexa 此次 API 更新的一个关键功能是,它提供了与外部服务更好的集成和针对语音激活媒体的更好粒度的控制,比如音量和回放控制。要使用该 API,我们不需要拥有亚马逊的设备,我们可以在线注册任何 Raspberry Pi 或者其他自定义硬件。这包含了对移动设备和服务器端消息服务的支持。这意味着,我们可以用自己硬件上的自定义编程的功能设计自己的语音用户界面。许多 NLP 平台要么是彻底地专注于软件,如谷歌的 Cloud Natural Language API ,要么提供大量设备集成支持,却牺牲了可定制性,破坏像苹果 HomeKit 这样包罗万象的应用生态系统的标准集。Alexa 的独特之处在于它添加的 API,在专注于语音识别能力的同时,又不迫使用户购买一整套平台解决方案而牺牲灵活性。

跳上 Alexa 花车的公司有生产语音控制的宠物喂食器的 Petnet 公司和生产车载应用控制系统的 Mojio 公司。这些应用现在可以使用到语音控制计时器和闹钟(和 Alexa 移动应用集成)以及系统级别的控制功能,比如静音和取消静音功能。Alexa 还介绍了与英特尔新合作发布的称为 Form Factor Reference 的设计。它是一种新型的英特尔主板设计,旨在减少开发时间,通过与 API 软件配对的硬件促进设备制造商进一步创造智能设备。

查看英文原文: Amazon Adds Finer Granularity of Control to Their Voice Recognition API


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-12-11 18:002140
用户头像

发布了 33 篇内容, 共 12.7 次阅读, 收获喜欢 10 次。

关注

评论

发布
暂无评论
发现更多内容

GreptimeDB v0.6 发布 | 支持 Datanodes 间迁移数据表 Region

Greptime 格睿科技

数据库 时序数据库 版本发布

构建智算时代的云原生应用平台,2023 云原生产业大会,阿里云在这里!

阿里巴巴云原生

阿里云 容器 云原生

SHQ Response 重新定义网络风险可视化与协作规则

财见

IntelliJ IDEA安装教程

小魏写代码

面试官:分库分表后如何生成全局ID?

王磊

Java 面试

《机器人流程自动化能力评估体系 第1部分:系统和工具》行标发布

王吉伟频道

RPA 机器人流程自动化 信通院 超自动化 行业标准

Hologres V2.1版本发布,新增计算组实例构建高可用实时数仓

阿里云大数据AI技术

Peplink 成为首家授权 Starlink 技术服务商

财见

JNPF低代码开发平台总体架构介绍

互联网工科生

软件开发 低代码 JNPF

Pixels:重新定义游戏体验的区块链农场游戏

Footprint Analytics

区块链游戏 链游 Pixels

操作系统寒武纪 :鸿蒙来了企业IT高兴吗?

FN0

鸿蒙 操作系统 HarmonyOS

管理型人格特质揭秘:适合测试管理的人应具备何种素质

测吧(北京)科技有限公司

测试

只需三步,开发文心一言应用帮你建立情感纽带!

飞桨PaddlePaddle

人工智能 深度学习 #飞桨# 飞桨AI

又一大模型技术开源!有道自研RAG引擎QAnything正式开放下载

有道技术团队

金融行业首个海量数据处理技术报告发布,“五化”技术助力金融数据潜能释放

腾讯云大数据

大数据

阿里云云原生专场精彩内容集锦丨2023 云原生产业大会

阿里巴巴云原生

阿里云 云原生

使用API接口获取拼多多商品详情

Noah

测试管理者的晋升秘籍:稳步提升职业地位的关键步骤

测吧(北京)科技有限公司

测试

掌握测试管理的能力图谱:方法论、技术与资源管理全解析

测吧(北京)科技有限公司

测试

数据安全应急响应政策汇总:一份从无到有的应急预案实战指南(附下载)

极盾科技

优化-Spring Boot项目服务端接口超时设置

alexgaoyh

Spring Boot Callable接口 @Transactional 接口超时

如何使用Postman导入Swagger API文档

Liam

后端 Postman 接口文档 API swagger

华为云医疗智能体eiHealth的高性能--AI助力医疗智慧化升级

人工智能 医疗 华为云

阿里云云原生助力安永创新驱动力实践探索

阿里巴巴云原生

阿里云 云原生

测试管理的核心知识点:岗位与职责全面解析

测吧(北京)科技有限公司

测试

华为发布2024数据中心能源十大趋势

财见

亚马逊为它们的语音识别API添加了更好粒度的控制_语言 & 开发_Margot Krouwer_InfoQ精选文章