【AICon】探索八个行业创新案例,教你在教育、金融、医疗、法律等领域实践大模型技术! >>> 了解详情
写点什么

阿里巴巴 NLP 新进展:隔离场景噪音,提取清晰目标声音

  • 2018-12-03
  • 本文字数:773 字

    阅读完需:约 3 分钟

阿里巴巴NLP新进展:隔离场景噪音,提取清晰目标声音

阿里巴巴数据科学研究所(Alibaba Institute of Data Science)近期在进行一项研究,该项目希望在嘈杂环境下进行语音识别,比如在拥挤的地铁系统或会议中心里,通过隔离噪声,从而获得目标对象清晰的声音。


阿里巴巴的解决方案一部分依靠硬件,一部分靠软件:通过一个远场麦克风阵列和复杂的深度学习算法在人群中隔离声音,大幅降低错误率。


相比之下,“最好”的语音识别技术单靠麦克风阵列才能达到 84%的准确率,而阿里巴巴表示,他们的模式准确率在说话人口音很重的情况下,仍可以保持在 94%至 95%之间。据了解,这一技术已经被部署在上海的一个语音地铁售票系统中,阿里巴巴正在考虑将其推广到更多城市。


语音并不是阿里巴巴唯一研究的领域。利用自然语言处理,在云端实时执行自动翻译,让来自俄罗斯、马来西亚等国的阿里巴巴零售客户可以用母语与客服进行对话,也是阿里巴巴研究的项目之一。阿里巴巴的客服中心每天都会接到数以万计的呼叫,他们也正在利用算法处理其中的一部分工作,名为 Alime 的智能客户服务引擎就是这一研究的成果。


Alime 就像谷歌的 Duplex 系统一样,可以进行电话交谈,回答基本问题不需要人工参与。在聊天环境中,它还能够从客户提供的文档中自动提取文本和图像。


自然语言处理技术的应用只是阿里巴巴人工智能的冰山一角。在阿里的二手商品市场上,阿里巴巴部署了一款定价机器人,可以与买家谈判,以确定价格。


这款机器人的开发并非易事,它需要学习谈判策略和有效的生成文本的方法,以激励反复谈判。但最终取得的效果还是不错的:应用这款机器人的用户比其他人的成交率高出 20%。


该项目负责人表示:大多数用户不是专业卖家,不清楚应该如何定价,也不清楚如何与买家沟通,这款机器人可以很好地解决这个问题。


原文链接:


https://venturebeat.com/2018/12/02/alibabas-image-search-algorithm-can-recognize-up-to-300-million-objects/


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-12-03 15:111332
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 262.7 次阅读, 收获喜欢 1293 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

被翻译成 12 种语言的深度学习名著重磅升级,75%新内容,让你豁然开朗!

图灵社区

Python 深度学习

从手动测试到自动化测试(上)

FunTester

强大的爬虫框架 Scrapy

智趣匠

Scrapy scrapy框架 10月月更

cstdio的源码学习分析08-设置文件流buffer函数setbuf

桑榆

源码刨析 10月月更 C++

数据治理,七种常犯的错误

雨果

数据治理

详解CAN总线:CAN总线报文格式—帧间隔

不脱发的程序猿

汽车电子 CAN总线报文格式 详解CAN总线 CAN帧间隔

Java 泛型

Yeats_Liao

后端 Java后端 Java core 10月月更

详解CAN总线:CAN总线报文格式—过载帧

不脱发的程序猿

汽车电子 CAN总线报文格式 详解CAN总线 CAN过载帧

Spring Boot「02」日志配置

Samson

Java spring 学习笔记 spring-boot 10月月更

Spring之DI依赖注入

楠羽

笔记 spring】 10月月更

后端Java随机比大小游戏实战讲解

魏铁锤

10月月更

requests的介绍

智趣匠

Python requests 10月月更

Beautiful Soup库的介绍

智趣匠

Python BeautifulSoup 10月月更

李宏毅《机器学习》P1-P2 学习笔记

Clarke

网络安全【漏洞安全】反序列化漏洞深入分析

网络安全学海

黑客 网络安全 信息安全 渗透测试 漏洞挖掘

一文搞懂CAN总线协议帧格式

不脱发的程序猿

汽车电子 CAN总线 CAN总线协议帧格式

理解NodeJS多进程

coder2028

node.js

令人头疼的Javascript隐式&强制转换

hellocoder2029

JavaScript

详解CAN总线:CAN总线报文格式—错误帧

不脱发的程序猿

汽车电子 CAN总线报文格式 详解CAN总线 CAN错误帧

2022-10-10:以下go语言代码输出什么?A:[1 2 3 0 1 2];B:死循环;C:[1 2 3 1 2 3];D:[1 2 3]。 package main import “fmt“

福大大架构师每日一题

golang 福大大 选择题

时间旅行调试与自动化测试的支持

iofod jude

前端 低代码

一文读懂Js中的this指向

hellocoder2029

JavaScript

详解CAN总线:CAN总线报文格式—遥控帧

不脱发的程序猿

汽车电子 CAN总线报文格式 详解CAN总线 CAN遥控帧

数据库自动化运维实践

穿过生命散发芬芳

数据库运维 10月月更

我为什么要使用 Tauri 构建 macOS 磁盘清理工具 PrettyClean

NinetyH

tauri ​Rust

被翻译成 12 种语言的深度学习名著重磅升级,75%新内容,让你豁然开朗!

图灵教育

Python 深度学习

数据结构学习,栈篇(链式栈)

IC00

读书笔记 数据结构 算法 10月月更

数据中台与业务中台的区别与联系

阿泽🧸

业务中台 10月月更

Red Hat Releases OptaPlanner 8

成长兔🐇

js作用域、作用域链和它的一些优化

hellocoder2029

JavaScript

【愚公系列】2022年10月 Go教学课程 024-函数

愚公搬代码

10月月更

阿里巴巴NLP新进展:隔离场景噪音,提取清晰目标声音_AI&大模型_KYLE WIGGERS_InfoQ精选文章