最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

Nuance 公司发布物联网开发平台:Nuance Mix

  • 2015-12-28
  • 本文字数:1797 字

    阅读完需:约 6 分钟

Nuance 公司是世界上最大的专门从事语音识别软件、图像处理软件及输入法软件研发、销售的公司。近日,Nuance 推出了一个专门针对移动和消费电子产品的开发平台—Nuance Mix。

提到 Nuance 公司,可能大家还不太熟悉,但如果告诉你,苹果 Siri 语音助手幕后的语音识别技术供应商就是 Nuance,大家就知道该公司的实力了。Nuance 的业务主要有三个部分,一是转录服务,可以让用户控制计算机应用程序和处理电子邮件,二是客户呼叫中心,当用户通过机器设备打客户服务电话被卡住时,Nuance 的技术就会帮你把要说的东西翻译出来,三是移动电话,已有超过 50 亿部手机使用了 Nuance 的技术。

苹果的 Siri,谷歌的 Google Now,和微软的 Cortana 现在都在做一个相当了不起的工作,那就是尽量让我们的生活变得更轻松。它们会提醒我们开会,帮助我们了解天气,告诉我们交通状态,推荐我们喜欢的电影和音乐。这些所有的智能服务现在越来越依赖于移动终端为我们提供便利。目前,Nuance 希望通过一个全新的开发平台 Nuance Mix 来让这些事情变得更加智能,Mix 的首要目标是确保消费电子和物联网都能够更好地理解的语音命令。

Nuance 公司表示,物联网革命是由用户体验驱动,这是当前开发者需要努力的方向,也正是 Nuance Mix 的用武之地。当前发布的测试版中,Nuance Mix 可以帮助设备制造商和开发人员快速、轻松地创建自定义语音和自然语言处理接口,以便加速下一代互联网的发展,包括智能家居、游戏、机器人,以及消费者健康和健身等行业。

该平台在功能上相当于一个全新的自然语言理解开发工具,具有 Nuance 的语音识别和文本转语音功能。Nuance 表示,Nuance Mix 是独一无二的,它可以让开发者定义他们的使用案例,各种各样的消费者能够通过语音与他们的设备或应用程序进行交互。通过 Nuance Mix,每个开发人员可以创建一个定制的智能语音和自然语言模型,随后被集成到他们的应用程序或设备中。结果,每一个语音交互都由开发者定义并创建,它可以对用户体验提供更多的控制。

使用 Nuance 领先的语音识别和文本转语音技术,开发者可以使用 Mix Web 接口在几分钟之内构建自定义语音和自然语言模型。在定制化程度的选择方面,开发者拥有了更多的选择自由,可以在设计、集成,以及语音和自然语言的开发需求上拥有选项。Nuance Mix 还为开发人员提供了一个自动化的工作流,它将匿名的语音数据持续返回到它们的模型中以不断提高精确度,用户的体验随着时间不断提升。

Nuance Mix 为消费电子和移动开发人员提供了最全面的语音工具和服务,是一个开放的平台,对类似 WebSockets 这样开放的互联网协议提供了跨操作系统和跨平台的支持。Nuance 公司表示,使用 Mix 工具,开发人员可以在他们的应用程序中植入完全的语音控制。这些控制可以帮助用户与设备进行自如的交互,例如当用户说“更新我的 Facebook 状态”时,应用程序能力正确理解它,并立刻执行。

Mix 的能力并不仅仅局限于应用程序。它也可以在硬件中执行。根据最新的一篇报道,该公司指出,其技术可以应用于智能手机和物联网产品。它目前还可以作为中间件对这些设备实施控制,并直接与设备本身交互。为了便于开发,Nuance Mix 提供了iOS 和Android SDK,以及示例应用程序,支持的语言包括Python,C,Java 脚本等等。

Nuance 的终极梦想是想要用语音控制一切,看来梦想正在一步步靠近。2016 年,Nuance Mix 将继续扩展它的工具和能力,以支持更多 Nuance 的业界领先的技术和语言组合。事实上,Nuance 开发者的语音识别和文本转语音工具包,让开发人员可以使用超过 40 种语言为消费电子设备和移动应用构建定制化的语言交互,以及可以选择超过 80 种不同的声音进行文本转语音。超过 30,000 名开发人员已经参加了 Nuance 的开发计划。

Nuance Mix 提供了最开放、最灵活的语音开发工具。Nuance Mix 现已推出测试版本,同时也在接受封闭测试,开发者需要通过“Nuance 开发者项目”才能使用这一平台。目前该公司已经接受关于封闭测试的申请。Nuance Mix 还没有进行定价,Nuance 日前在接受采访时表示,他们将在最终价格上为中小公司提供一些优惠措施。


感谢董志南对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2015-12-28 18:001671
用户头像

发布了 268 篇内容, 共 118.1 次阅读, 收获喜欢 24 次。

关注

评论

发布
暂无评论
发现更多内容

华为联合中软举办鸿蒙生态人才培养训练营,深入百校赋能千人

最新动态

欧特克与中国建筑西南设计研究院建立战略合作关系,以BIM技术助推工程建设行业数字化升级

E科讯

大模型训练,实现人工智能的关键一步

百度开发者中心

自然语言 大模型 人工智能’

百度Comate SaaS版本正式发布,助力开发者加速研发过程

飞桨PaddlePaddle

智能代码助手 百度Comate SaaS

Bettertouchtool 4 for Mac触控板增强软件

展初云

Mac软件 触控板增强 Bettertouchtool

渗透测试-内网大规模文件传输

云起无垠

保护企业数据安全、防止数据泄露,只差这一步

NineData

权限控制 用户 数据泄露 SQL开发 NineData

PaddleX场景实战:PP-TS在电压预测场景上的应用

飞桨PaddlePaddle

PaddleX

ElasticSearch安装、插件介绍及Kibana的安装与使用详解

汀丶人工智能

Kibana Elastic Search

音画双绝,坚果O2超短焦系列引领超短焦投影进入三色激光时代

Geek_2d6073

云计算技术的新发展:公有云、私有云还是混合云的未来?

Finovy Cloud

云计算 AI 公有云 私有云 混合云

logstash 与ElasticSearch:从CSV文件到搜索宝库的导入指南

汀丶人工智能

Elastic Search 搜索系统

单表 1000 万条数据,TDengine 助力麦当劳中国实现 PERCENTILE 秒级查询优化

TDengine

时序数据库 ​TDengine

Spring Bean 名称暗藏玄机,这样取名就不会被代理

江南一点雨

Java spring

基于Web的智慧陆上风电场3D运维平台

2D3D前端可视化开发

风力发电 三维可视化 智慧风电 智慧风场 智慧风电场

基于k3s+istio搭建一个云平台

Kevin_913

istio k3s Cloud Native

Experience Design for Mac( XD ) v57.1.12.2永久激活版

mac

苹果mac Windows软件 XD 原型制作的软件

1024程序员节,一个ETL工程师的日常工作​

RestCloud

1024 1024程序员节 ETL

瑞识科技推动红光VCSEL多领域创新应用并量产出货超千万颗

硬科技星球

IPQ6010+QCN9074|QCN9074-6E Throughput Test Report in DR6018

wallyslilly

IPQ6010 QCN9074

在 CentOS 平台下安装与配置 MySQL 5.7.36

小齐写代码

深度理解预训练语言模型

百度开发者中心

自然语言处理 大模型 LLM

Microsoft Remote Desktop for Mac(远程桌面控制工具)

展初云

Mac 远程软件 microsoft remote desktop

数据集与模型的优化策略

百度开发者中心

预训练模型 大模型 人工智能’

融云AIGC专题:高知识密度与大数据处理双向奔赴的「金融大模型」

融云 RongCloud

大数据 AI 金融 大模型 AIGC

Nuance公司发布物联网开发平台:Nuance Mix_语言 & 开发_张天雷_InfoQ精选文章