生成式AI领域的最新成果都在这里!抢 QCon 展区门票 了解详情
写点什么

Nuance 公司发布物联网开发平台:Nuance Mix

  • 2015-12-28
  • 本文字数:1797 字

    阅读完需:约 6 分钟

Nuance 公司是世界上最大的专门从事语音识别软件、图像处理软件及输入法软件研发、销售的公司。近日,Nuance 推出了一个专门针对移动和消费电子产品的开发平台—Nuance Mix。

提到 Nuance 公司,可能大家还不太熟悉,但如果告诉你,苹果 Siri 语音助手幕后的语音识别技术供应商就是 Nuance,大家就知道该公司的实力了。Nuance 的业务主要有三个部分,一是转录服务,可以让用户控制计算机应用程序和处理电子邮件,二是客户呼叫中心,当用户通过机器设备打客户服务电话被卡住时,Nuance 的技术就会帮你把要说的东西翻译出来,三是移动电话,已有超过 50 亿部手机使用了 Nuance 的技术。

苹果的 Siri,谷歌的 Google Now,和微软的 Cortana 现在都在做一个相当了不起的工作,那就是尽量让我们的生活变得更轻松。它们会提醒我们开会,帮助我们了解天气,告诉我们交通状态,推荐我们喜欢的电影和音乐。这些所有的智能服务现在越来越依赖于移动终端为我们提供便利。目前,Nuance 希望通过一个全新的开发平台 Nuance Mix 来让这些事情变得更加智能,Mix 的首要目标是确保消费电子和物联网都能够更好地理解的语音命令。

Nuance 公司表示,物联网革命是由用户体验驱动,这是当前开发者需要努力的方向,也正是 Nuance Mix 的用武之地。当前发布的测试版中,Nuance Mix 可以帮助设备制造商和开发人员快速、轻松地创建自定义语音和自然语言处理接口,以便加速下一代互联网的发展,包括智能家居、游戏、机器人,以及消费者健康和健身等行业。

该平台在功能上相当于一个全新的自然语言理解开发工具,具有 Nuance 的语音识别和文本转语音功能。Nuance 表示,Nuance Mix 是独一无二的,它可以让开发者定义他们的使用案例,各种各样的消费者能够通过语音与他们的设备或应用程序进行交互。通过 Nuance Mix,每个开发人员可以创建一个定制的智能语音和自然语言模型,随后被集成到他们的应用程序或设备中。结果,每一个语音交互都由开发者定义并创建,它可以对用户体验提供更多的控制。

使用 Nuance 领先的语音识别和文本转语音技术,开发者可以使用 Mix Web 接口在几分钟之内构建自定义语音和自然语言模型。在定制化程度的选择方面,开发者拥有了更多的选择自由,可以在设计、集成,以及语音和自然语言的开发需求上拥有选项。Nuance Mix 还为开发人员提供了一个自动化的工作流,它将匿名的语音数据持续返回到它们的模型中以不断提高精确度,用户的体验随着时间不断提升。

Nuance Mix 为消费电子和移动开发人员提供了最全面的语音工具和服务,是一个开放的平台,对类似 WebSockets 这样开放的互联网协议提供了跨操作系统和跨平台的支持。Nuance 公司表示,使用 Mix 工具,开发人员可以在他们的应用程序中植入完全的语音控制。这些控制可以帮助用户与设备进行自如的交互,例如当用户说“更新我的 Facebook 状态”时,应用程序能力正确理解它,并立刻执行。

Mix 的能力并不仅仅局限于应用程序。它也可以在硬件中执行。根据最新的一篇报道,该公司指出,其技术可以应用于智能手机和物联网产品。它目前还可以作为中间件对这些设备实施控制,并直接与设备本身交互。为了便于开发,Nuance Mix 提供了iOS 和Android SDK,以及示例应用程序,支持的语言包括Python,C,Java 脚本等等。

Nuance 的终极梦想是想要用语音控制一切,看来梦想正在一步步靠近。2016 年,Nuance Mix 将继续扩展它的工具和能力,以支持更多 Nuance 的业界领先的技术和语言组合。事实上,Nuance 开发者的语音识别和文本转语音工具包,让开发人员可以使用超过 40 种语言为消费电子设备和移动应用构建定制化的语言交互,以及可以选择超过 80 种不同的声音进行文本转语音。超过 30,000 名开发人员已经参加了 Nuance 的开发计划。

Nuance Mix 提供了最开放、最灵活的语音开发工具。Nuance Mix 现已推出测试版本,同时也在接受封闭测试,开发者需要通过“Nuance 开发者项目”才能使用这一平台。目前该公司已经接受关于封闭测试的申请。Nuance Mix 还没有进行定价,Nuance 日前在接受采访时表示,他们将在最终价格上为中小公司提供一些优惠措施。


感谢董志南对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2015-12-28 18:001664
用户头像

发布了 268 篇内容, 共 117.9 次阅读, 收获喜欢 24 次。

关注

评论

发布
暂无评论
发现更多内容

区块链技术,让数字政务跑出“加速度”

CECBC

第1章-《Linux一学就会》-Linux课程介绍-学习环境搭建

学神来啦

Linux 运维 contos

博睿数据 短信服务监测解决方案专场直播

博睿数据

汽车行业的进化秘诀,竟在这座智慧出行乐园中……

脑极体

边缘使用 K8s 门槛太高?OpenYurt 这个功能帮你快速搭建集群!

阿里巴巴云原生

阿里云 云原生 边缘计算

人民币突传大好消息,首款数字货币“官宣”了!

CECBC

vue之keep-alive作用和原理

法医

大前端 9月日更

Opus从入门到精通(三)手撸一个Opus编码程序

轻口味

音视频 9月日更 Andriod

代码的艺术

百度开发者中心

最佳实践 方法论 代码

权威报告显示:BATH坐稳中国四朵云

科技热闻

CSS交互动画指南之transition

devpoint

CSS css3 transform 引航计划 9月日更

Node 编码规范 -努力做得更好

Geek_25b8d1

node.js Node 规范

隐私计算﹢区块链:让数据真正成为生产要素

CECBC

做安全操作系统,这位技术老兵是认真的!

熵核科技

安全操作系统

Android 上的 Kotlin 协程

Changing Lin

9月日更

别把云原生想复杂了

dinstone

微服务 云原生 云平台

智能汽车安全保障亟待加强,熵核科技助力“人车互联”

熵核科技

系统安全 自动驾驶安全

模块八作业

Clarke

声网推出首个完整实时合唱解决方案 即将上线“咪哒”全国线下K歌房

声网

人工智能 音频体验

行云创新亮相“OSCAR开源产业大会”:云调试加速应用创新

行云创新

探索:北鲲云超算平台能否应用于中医药行业

北鲲云

北鲲云探索医药研发,云计算再添新应用场景

北鲲云

DDD实战分享-消息中心

麦麦

微服务 gRPC DDD 领域驱动设计DDD

【直播预告】阿里云服务网格 ASM 产品易用性改善实践与思考

阿里巴巴云原生

阿里云 云原生

Neuron v1.3.2 正式发布:新 logo、新界面、新可能

EMQ映云科技

边缘计算 网关 边缘流式数据 边云协同 emq

阿里初面被两道编程题给干掉?,再次内推终上岸(已拿电子offer)

今晚早点睡

Java Alibaba

面试官:MySQL的幻读是怎么被解决的?

Java MySQL 编程 架构 后端

即时通讯系统架构设计-如何设计一款WhatsApp

OpenIM

耗时大半个月收整全套「Java架构进阶pdf」没白费,Github上点赞破十万!

Java 程序员 面试 计算机 金九银十

惊掉下巴!这本Alibaba百万年薪必备—高性能架构路线震撼出世!

Java 编程 程序员 架构 计算机

阿里巴巴最新最全800道Java后端面试大全(值得收藏)

Java 程序员 编程语言 java面试 java架构

Nuance公司发布物联网开发平台:Nuance Mix_语言 & 开发_张天雷_InfoQ精选文章