2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

亚马逊为它们的语音识别 API 添加了更好粒度的控制

  • 2016-12-11
  • 本文字数:1050 字

    阅读完需:约 3 分钟

亚马逊的语音服务API Alexa 是为亚马逊 Echo 提供支持的NLP(自然语言处理)API。它有一个新的更新,开发人员通过使用语音识别功能API 可以将任何设备转换为“智能”设备。

像微软和谷歌这样的科技巨擘最新发布了几个大规模的NLP,Alexa API 就是其中之一。Alexa 尤其专注于设备和语音识别的集成,这一点和IBM 最近使用它的云平台Bluemix 提供的API 所做的非常相似。Alexa 被设计为一个开发者API,针对希望让不断增长的“物联网”设备市场更加有序的公司。当前智能设备的一个关键问题是它们都存在于不同平台上,具有不同级别的能力和安全性。家里的Hue 灯不知道怎样与八月智能锁通信,这给更高级的可重用的物联网短语带来了障碍。比如“我要出门了”,这样的短语会创建一条自动的命令链来关灯和锁门。苹果的HomeKit 虽然已经取得了长足的进步,使得我们不需要人工地与大量不同用户界面的App 打交道和登录,但是就针对开发的可定制的语音识别API 而言,却收效甚微。HomeKit 是直接与Siri 集成的。

Alexa 此次 API 更新的一个关键功能是,它提供了与外部服务更好的集成和针对语音激活媒体的更好粒度的控制,比如音量和回放控制。要使用该 API,我们不需要拥有亚马逊的设备,我们可以在线注册任何 Raspberry Pi 或者其他自定义硬件。这包含了对移动设备和服务器端消息服务的支持。这意味着,我们可以用自己硬件上的自定义编程的功能设计自己的语音用户界面。许多 NLP 平台要么是彻底地专注于软件,如谷歌的 Cloud Natural Language API ,要么提供大量设备集成支持,却牺牲了可定制性,破坏像苹果 HomeKit 这样包罗万象的应用生态系统的标准集。Alexa 的独特之处在于它添加的 API,在专注于语音识别能力的同时,又不迫使用户购买一整套平台解决方案而牺牲灵活性。

跳上 Alexa 花车的公司有生产语音控制的宠物喂食器的 Petnet 公司和生产车载应用控制系统的 Mojio 公司。这些应用现在可以使用到语音控制计时器和闹钟(和 Alexa 移动应用集成)以及系统级别的控制功能,比如静音和取消静音功能。Alexa 还介绍了与英特尔新合作发布的称为 Form Factor Reference 的设计。它是一种新型的英特尔主板设计,旨在减少开发时间,通过与 API 软件配对的硬件促进设备制造商进一步创造智能设备。

查看英文原文: Amazon Adds Finer Granularity of Control to Their Voice Recognition API


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-12-11 18:002282
用户头像

发布了 33 篇内容, 共 13.1 次阅读, 收获喜欢 10 次。

关注

评论

发布
暂无评论
发现更多内容

贺!亚马逊云科技生成式AI能力认证释放GenAI能量,重塑客户体验!

伊克罗德信息科技

企业上云的优点、难点及SD-WAN解决方案的探讨

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SDWAN

玩转豆包大模型,火山引擎助力小爱打造“最强大脑”

新消费日报

开启多屏时代,让设备不再吃灰!ToDesk、Spacedesk、EV、Duet Display扩展屏实测报告

小喵子

ToDesk 多屏 扩展屏

深入理解 pytest 测试框架

测吧(北京)科技有限公司

测试

音频剪裁大师:使用 Python 和 ffmpeg 分割音频的完整指南

霍格沃兹测试开发学社

SD-WAN企业组网六大优点

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SDWAN

【中英互译】可以为你出谋划策的AI翻译

AppBuilder

VSCode安装使用教程,保姆级!

霍格沃兹测试开发学社

预告|博睿数据将受邀出席GOPS全球运维大会北京站!

博睿数据

基于云效 AppStack,5 分钟搞定一个 AI 应用的开发和部署

阿里云云效

阿里云 云原生 云效

数栈xAI:轻量化、专业化、模块化,四大功能革新 SQL 开发体验

袋鼠云数栈

大数据 AI 大模型 大数据模型 数据大模型

使用Postman发送POST请求的指南

霍格沃兹测试开发学社

从线上到线下!和鲸科技携手中国地质大学 UrbanComp,共绘 GeoAI 教学实践新篇章

ModelWhale

Python 人工智能 遥感影像 地球科学

Fluid 1.0 版发布,打通云原生高效数据使用的“最后一公里”

阿里巴巴云原生

阿里云 云原生 Fluid

【技术分享】重点机器状态变更飞书通知

伊克罗德信息科技

基于云效 AppStack,5 分钟搞定一个 AI 应用的开发和部署

阿里巴巴云原生

阿里云 云原生 云效

天谋科技与慢牛科技完成兼容性互认证

Apache IoTDB

pytest 参数化测试用例

测吧(北京)科技有限公司

测试

无缝融合:使用 Python 和 PyFFmpeg 合并视频的完整指南

霍格沃兹测试开发学社

【IoTDB 线上小课 04】时序数据库怎么选?揭秘性能核心指标!

Apache IoTDB

干货下载 |《数据治理:数据中台建设与能力提升策略》

博睿数据

深入探索Chrome开发者工具:开发者的利器

霍格沃兹测试开发学社

活动回顾丨飞天技术沙龙 Serverless + AI 专场(上海站)回顾 & PPT 下载

阿里巴巴云原生

阿里云 Serverless 云原生

Postman变量使用指南

霍格沃兹测试开发学社

做了2年前端,盘点前端技术栈!大佬轻喷~

伤感汤姆布利柏

inBuilder 低代码平台新特性推荐 - 第二十一期

inBuilder低代码平台

开源 低代码

亚马逊为它们的语音识别API添加了更好粒度的控制_语言 & 开发_Margot Krouwer_InfoQ精选文章