写点什么

阿里巴巴 NLP 新进展:隔离场景噪音,提取清晰目标声音

  • 2018-12-03
  • 本文字数:773 字

    阅读完需:约 3 分钟

阿里巴巴NLP新进展:隔离场景噪音,提取清晰目标声音

阿里巴巴数据科学研究所(Alibaba Institute of Data Science)近期在进行一项研究,该项目希望在嘈杂环境下进行语音识别,比如在拥挤的地铁系统或会议中心里,通过隔离噪声,从而获得目标对象清晰的声音。


阿里巴巴的解决方案一部分依靠硬件,一部分靠软件:通过一个远场麦克风阵列和复杂的深度学习算法在人群中隔离声音,大幅降低错误率。


相比之下,“最好”的语音识别技术单靠麦克风阵列才能达到 84%的准确率,而阿里巴巴表示,他们的模式准确率在说话人口音很重的情况下,仍可以保持在 94%至 95%之间。据了解,这一技术已经被部署在上海的一个语音地铁售票系统中,阿里巴巴正在考虑将其推广到更多城市。


语音并不是阿里巴巴唯一研究的领域。利用自然语言处理,在云端实时执行自动翻译,让来自俄罗斯、马来西亚等国的阿里巴巴零售客户可以用母语与客服进行对话,也是阿里巴巴研究的项目之一。阿里巴巴的客服中心每天都会接到数以万计的呼叫,他们也正在利用算法处理其中的一部分工作,名为 Alime 的智能客户服务引擎就是这一研究的成果。


Alime 就像谷歌的 Duplex 系统一样,可以进行电话交谈,回答基本问题不需要人工参与。在聊天环境中,它还能够从客户提供的文档中自动提取文本和图像。


自然语言处理技术的应用只是阿里巴巴人工智能的冰山一角。在阿里的二手商品市场上,阿里巴巴部署了一款定价机器人,可以与买家谈判,以确定价格。


这款机器人的开发并非易事,它需要学习谈判策略和有效的生成文本的方法,以激励反复谈判。但最终取得的效果还是不错的:应用这款机器人的用户比其他人的成交率高出 20%。


该项目负责人表示:大多数用户不是专业卖家,不清楚应该如何定价,也不清楚如何与买家沟通,这款机器人可以很好地解决这个问题。


原文链接:


https://venturebeat.com/2018/12/02/alibabas-image-search-algorithm-can-recognize-up-to-300-million-objects/


2018-12-03 15:111586
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 294.0 次阅读, 收获喜欢 1305 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容
阿里巴巴NLP新进展:隔离场景噪音,提取清晰目标声音_AI&大模型_KYLE WIGGERS_InfoQ精选文章