Facebook 公布最新的神经网络机器翻译算法

  • Roland Meertens
  • 薛命灯

2017 年 5 月 25 日

话题:Facebook大数据语言 & 开发架构AI

Facebook 的人工智能研究团队公布了他们最新的神经网络机器翻译(NMT)研究成果。同时进行三个机器翻译任务,他们的算法比其他任何一个系统的得分都要高,而且比 Google 的 NMT 系统快上 9 倍。

Facebook 使用了卷积神经网络,该技术在计算机视觉领域得到广泛应用。它以一种结构化的顺序来处理句子,捕捉句子成分之间复杂的关系。Facebook 对计算机进行训练,让它们能够识别出句子(由两个、三个、四个或更多的单词组成)各个部分的含义。通过使用神经网络来处理句子,计算机可以理解句子各个部分的含义。然后使用另一种神经网络将这些意思转译成另外一门语言。

卷积的主要优势在于,你可以同时将其应用在句子的多个成分上。传统的 NMT 技术逐字地读取句子,然后记下句子在当前位置的意思。计算机的速度限制了串行化读取的速度,结果就是 Facebook 的算法可以比串行化读取技术最多快上 9 倍。

他们还引入一种新的技术,叫作“multi-hop”。这种技术并不是整句地读取然后整句地翻译,而是进行逐字翻译。multi-hop 是一种新技术,比“专注”(attention)机制更智能、更复杂。专注机制是解决多义词问题的关键。一个单词在不同的上下文里具有不同的含义。在翻译一个单词的时候,专注机制根据原文的相关部分为单词选择最合适的释义,从而解决多义词问题。

Facebook 打算将他们的新技术应用在其他文字处理任务上,比如使用神经网络来回答问题。新技术可以让他们同时专注于对话的每一个部分。他们在博客上完整地介绍了他们的新技术,还有一份可以自由访问的论文。如果有人想尝试他们的算法,可以从GitHub下载代码。

在进行英语到法语、英语到德语和英语到罗马尼亚语的翻译时,新算法比其他任何一个算法都要快。它打败了 Google 的神经网络机器翻译技术。Google Translate SDK提供了 Google 的翻译算法,可以支持20 种语言互译组合。如果有人想知道 NMT 和传统技术之间的区别,可以试着使用Microsoft Translator来翻译他们喜欢的内容。

查看英文原文: Facebook Publishes New Neural Machine Translation Algorithm

Facebook大数据语言 & 开发架构AI