写点什么

阿里巴巴 NLP 新进展:隔离场景噪音,提取清晰目标声音

  • 2018-12-03
  • 本文字数:773 字

    阅读完需:约 3 分钟

阿里巴巴NLP新进展:隔离场景噪音,提取清晰目标声音

阿里巴巴数据科学研究所(Alibaba Institute of Data Science)近期在进行一项研究,该项目希望在嘈杂环境下进行语音识别,比如在拥挤的地铁系统或会议中心里,通过隔离噪声,从而获得目标对象清晰的声音。


阿里巴巴的解决方案一部分依靠硬件,一部分靠软件:通过一个远场麦克风阵列和复杂的深度学习算法在人群中隔离声音,大幅降低错误率。


相比之下,“最好”的语音识别技术单靠麦克风阵列才能达到 84%的准确率,而阿里巴巴表示,他们的模式准确率在说话人口音很重的情况下,仍可以保持在 94%至 95%之间。据了解,这一技术已经被部署在上海的一个语音地铁售票系统中,阿里巴巴正在考虑将其推广到更多城市。


语音并不是阿里巴巴唯一研究的领域。利用自然语言处理,在云端实时执行自动翻译,让来自俄罗斯、马来西亚等国的阿里巴巴零售客户可以用母语与客服进行对话,也是阿里巴巴研究的项目之一。阿里巴巴的客服中心每天都会接到数以万计的呼叫,他们也正在利用算法处理其中的一部分工作,名为 Alime 的智能客户服务引擎就是这一研究的成果。


Alime 就像谷歌的 Duplex 系统一样,可以进行电话交谈,回答基本问题不需要人工参与。在聊天环境中,它还能够从客户提供的文档中自动提取文本和图像。


自然语言处理技术的应用只是阿里巴巴人工智能的冰山一角。在阿里的二手商品市场上,阿里巴巴部署了一款定价机器人,可以与买家谈判,以确定价格。


这款机器人的开发并非易事,它需要学习谈判策略和有效的生成文本的方法,以激励反复谈判。但最终取得的效果还是不错的:应用这款机器人的用户比其他人的成交率高出 20%。


该项目负责人表示:大多数用户不是专业卖家,不清楚应该如何定价,也不清楚如何与买家沟通,这款机器人可以很好地解决这个问题。


原文链接:


https://venturebeat.com/2018/12/02/alibabas-image-search-algorithm-can-recognize-up-to-300-million-objects/


2018-12-03 15:111640
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 300.0 次阅读, 收获喜欢 1306 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

学生系统架构图

lory(侯保国)

卓越实力备受认可 HashData再获权威大奖

酷克数据HashData

金融科技 数据库·

AI技术赋能数智化转型,激发企业变革创新

用友BIP

Elasticsearch查询及聚合类DSL语句宝典

京东科技开发者

数据库 存储 ES dsl 查询语句

「实操」结合图数据库、图算法、机器学习、GNN 实现一个推荐系统

NebulaGraph

推荐系统 图数据库 图算法 GNN

使用 QuTrunk+Amazon ParallelCluster3 进行并行计算

亚马逊云科技 (Amazon Web Services)

亚马逊云科技 Hero 专栏

运维自动化之监控平台

大V

DevOps 运维自动化 监控报警

学习下Redis内存模型

京东科技开发者

Java 前端 内存 数据存储 内部编码

单测在商家前端业务中的实践

得物技术

架构 前端 Web 测试 单元测试 12 月 PK 榜

天猫联合瓴羊、贝恩,打造“产品致胜”的DTC发展模式

瓴羊企业智能服务

架构实战营第10期模块3作业

Geek_4db2d5

协同高效运转,华为云桌面助力企业数字化转型!

科技说

【漏洞分析】Apache ShardingSphere-Proxy <5.3.0 身份认证绕过

墨菲安全

开源 安全漏洞 软件供应链安全

数据可视化软件有哪些?

优秀

数据可视化工具

内卷时代,华为云引领移动办公新潮流

清欢科技

【世界杯黑技术专题】「原理探索专题」一文解读一下“卡塔尔世界杯”的先进技术之半自动越位技术SAOT+比赛用球Al Rihla

码界西柚

12月日更 世界杯 世界杯黑科技

5大理由告诉你,为什么选择华为云桌面

与时俱进的时代

架构实战营第十期模块三作业

刘博

全网最全 java 进制转换详解

千锋IT教育

程序员是“短命”职业吗?年龄大了是不是没前途?

千锋IT教育

基于Redis实现DelayQueue延迟队列设计方案(附源码)

石臻臻的杂货铺

redis

Mysql到TiDB迁移,双写数据库兜底方案

京东科技开发者

数据库 开源 开发 迁移 双写数据库

由浅入深剖析JDK源码!美团大牛手撸并发原理笔记真香

Java永远的神

程序员 并发编程 后端 jdk源码 架构师

微信业务架构图

lory(侯保国)

数据库原理及MySQL应用 | 数据表操作

TiAmo

:MySQL 数据库 数据库· 12月月更

现在即未来,华为云桌面引领桌面变革新潮

科技说

阿里云IoT物联网实例讲解——实践类

阿里云AIoT

阿里云 物联网平台 IoT 设备管理

TCP-SYN超时重传问题排查

Kevin Wu

高并发 网关 TCP协议

数字孪生赋能智慧港口解决方案,助力港口数字化转型

袋鼠云数栈

数字孪生

阿里最新产:SpringCloud微服务架构进阶笔记(2023终极版)

程序员小毕

程序员 微服务 后端 架构师 java面试

物联网设备端的传感器数据如何实时上报到云平台——实践类

阿里云AIoT

安全 物联网 物联网安全 技术标签

阿里巴巴NLP新进展:隔离场景噪音,提取清晰目标声音_AI&大模型_KYLE WIGGERS_InfoQ精选文章