阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

亚马逊为它们的语音识别 API 添加了更好粒度的控制

  • 2016-12-11
  • 本文字数:1050 字

    阅读完需:约 3 分钟

亚马逊的语音服务API Alexa 是为亚马逊 Echo 提供支持的NLP(自然语言处理)API。它有一个新的更新,开发人员通过使用语音识别功能API 可以将任何设备转换为“智能”设备。

像微软和谷歌这样的科技巨擘最新发布了几个大规模的NLP,Alexa API 就是其中之一。Alexa 尤其专注于设备和语音识别的集成,这一点和IBM 最近使用它的云平台Bluemix 提供的API 所做的非常相似。Alexa 被设计为一个开发者API,针对希望让不断增长的“物联网”设备市场更加有序的公司。当前智能设备的一个关键问题是它们都存在于不同平台上,具有不同级别的能力和安全性。家里的Hue 灯不知道怎样与八月智能锁通信,这给更高级的可重用的物联网短语带来了障碍。比如“我要出门了”,这样的短语会创建一条自动的命令链来关灯和锁门。苹果的HomeKit 虽然已经取得了长足的进步,使得我们不需要人工地与大量不同用户界面的App 打交道和登录,但是就针对开发的可定制的语音识别API 而言,却收效甚微。HomeKit 是直接与Siri 集成的。

Alexa 此次 API 更新的一个关键功能是,它提供了与外部服务更好的集成和针对语音激活媒体的更好粒度的控制,比如音量和回放控制。要使用该 API,我们不需要拥有亚马逊的设备,我们可以在线注册任何 Raspberry Pi 或者其他自定义硬件。这包含了对移动设备和服务器端消息服务的支持。这意味着,我们可以用自己硬件上的自定义编程的功能设计自己的语音用户界面。许多 NLP 平台要么是彻底地专注于软件,如谷歌的 Cloud Natural Language API ,要么提供大量设备集成支持,却牺牲了可定制性,破坏像苹果 HomeKit 这样包罗万象的应用生态系统的标准集。Alexa 的独特之处在于它添加的 API,在专注于语音识别能力的同时,又不迫使用户购买一整套平台解决方案而牺牲灵活性。

跳上 Alexa 花车的公司有生产语音控制的宠物喂食器的 Petnet 公司和生产车载应用控制系统的 Mojio 公司。这些应用现在可以使用到语音控制计时器和闹钟(和 Alexa 移动应用集成)以及系统级别的控制功能,比如静音和取消静音功能。Alexa 还介绍了与英特尔新合作发布的称为 Form Factor Reference 的设计。它是一种新型的英特尔主板设计,旨在减少开发时间,通过与 API 软件配对的硬件促进设备制造商进一步创造智能设备。

查看英文原文: Amazon Adds Finer Granularity of Control to Their Voice Recognition API


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2016-12-11 18:001688
用户头像

发布了 33 篇内容, 共 10.5 次阅读, 收获喜欢 10 次。

关注

评论

发布
暂无评论
发现更多内容

2023-08-06:小青蛙住在一条河边, 它想到河对岸的学校去学习 小青蛙打算经过河里 的石头跳到对岸 河里的石头排成了一条直线, 小青蛙每次跳跃必须落在一块石头或者岸上 给定一个长度为n的数组ar

福大大架构师每日一题

福大大架构师每日一题 左神

Bito AI: IDEA 代码提效插件

Monin

AI IDEA chrom AIGC 代码提效

CentOS 7内核升级教程。

百度搜索:蓝易云

云计算 Linux centos 运维 内核

在云服务器中部署stable diffusion webui教程。

百度搜索:蓝易云

Linux 运维 webUI Diffusion Stable

亲临时代,成为历史

少油少糖八分饱

读书感悟 财富 时代发展 职业道路 阅读笔记

深入理解 HDFS(二):Replica

冰心的小屋

hdfs replica 大数据存储

代码随想录Day39 - 动态规划(二)

jjn0703

软件测试 | 忘记MySQL的root密码

测吧(北京)科技有限公司

测试

技术分享 | App常见bug解析

霍格沃兹测试开发学社

Zebec 创始人 Sam 对话社区,“Zebec 生态发展”主题 AMA 回顾总结

股市老人

代码随想录Day38 - 动态规划(一)

jjn0703

用React仿钉钉审批流、工作流

悠闲的水

前端 工作流 流程审批系统

Zebec 创始人 Sam 对话社区,“Zebec 生态发展”主题 AMA 回顾总结

西柚子

技术分享 | Appium环境安装与架构介绍

霍格沃兹测试开发学社

HDC.Together 2023高校人才生态论坛成功举办

最新动态

HDC2023:元服务助力梦里水乡发展智慧文旅,让服务触手可及

最新动态

Screen Recorder by Omi for Mac(屏幕录制软件) v1.3.2中文版

mac

屏幕录制 苹果mac Screen Recorder by Omi

技术分享 | Spring Boot 异常处理

霍格沃兹测试开发学社

接口测试必备技能-常见接口协议解析

霍格沃兹测试开发学社

技术分享 | Appium 用例录制

霍格沃兹测试开发学社

Redash可视化BI系统部署安装及简单使用

百度搜索:蓝易云

云计算 Linux 运维 BI redash

软件测试 | Cluster的启动

测吧(北京)科技有限公司

测试

软件测试 | 客户端怎么访问内网数据库

测吧(北京)科技有限公司

测试

技术分享 | app自动化测试(Android)--元素定位方式与隐式等待

霍格沃兹测试开发学社

多方聚力共育人才,华为携手产学研赋能HarmonyOS开发者

最新动态

Go 语法

小万哥

Go 编程 程序员 云原生 后端

聊聊测试开发工程师的职责定位问题

大卡尔

测试开发

Zebec 创始人 Sam 对话社区,“Zebec 生态发展”主题 AMA 回顾总结

大瞿科技

Monkey基本参数介绍

霍格沃兹测试开发学社

Zebec 创始人 Sam 对话社区,“Zebec 生态发展”主题 AMA 回顾总结

BlockChain先知

技术分享 | app自动化测试(Android)--App 控件定位

霍格沃兹测试开发学社

亚马逊为它们的语音识别API添加了更好粒度的控制_语言 & 开发_Margot Krouwer_InfoQ精选文章