Facebook转向神经网络机器翻译（NMT）_Meta_Alex Giamas

【AICon】如何构建高效的 RAG 系统？RAG 技术在实际应用中遇到的挑战及应对策略？>>> 了解详情 



 写点什么

Facebook 近期宣布面向全球推出 NMT （神经网络机器翻译，Neural Machine Translation）。从基于短语的翻译模型转向 NMT，使得 Facebook 可以支持超过两千种的语言互译，并达到了每天 45 亿次的翻译量。据 Facebook 介绍，NMT 使得 BLUE 分值增加了 11%。 BLEU 是一种广为使用的翻译评分机制。

撰写该博文的工程师 Juan Miguel Pino、Alexander Sidorov 和 Necip Fazil Ayan 使用 Caffe2 实现了 2.5 倍的性能提升。Caffe2 是 Facebook 于今年早期开源的一个机器学习框架。

NMT 实现如此质量翻译的关键，在于它使用的 RNN（Recurrent Neural Network）是一种具有注意机制（Attention）的Seq2Seq（Sequence-to-Sequence） LSTM （long short-term memory）。这样的系统充分考虑到了原始语句的上下文以及该语句之前的全部内容，用于生成更为准确的翻译内容。这使得在翻译中可以使用长距离调序规则（Long-distance Reordering），解决了一些存在于英语 - 土耳其语和英语 - 希腊语等语言互译中的问题。

LSTM 的注意机制（Attention）在处理翻译中未知词汇上非常有用，它将翻译软对齐到由训练数据构建的双语语料库，并使用了削减词汇量（Vocabulary reduction）方法，在避免对翻译质量产生显著影响的情况下，有效地降低了计算时间。

FB Learner Flow 框架用于快速并准确地调优每一种语言互译所使用的参数。3.7% 的英语 - 西班牙语互译 BLEU 分值增加来自于该框架的贡献。

作为项目的一部分，Facebook 将 RNN 贡献到 Caffe2 项目中，并作了开源。同时，Facebook 的FAIR（Facebook’s Artificial Intelligence Research）研究团队已经公开发表了他们在机器翻译中使用 CNN（convolutional neural networks）的方法。

Google 在 2016 年就发布了用于 Google 翻译的 NMT ，先于 Facebook 此次发布达多个月。而在一个月前，Google 宣布了 Multimodel 神经网络模型这一突破性进展。

查看英文原文： Facebook Transitioning to Neural Machine Translation

发布

暂无评论

促进软件开发及相关领域知识与创新的传播
关于我们
我要投稿
合作伙伴
加入我们
关注我们
联系我们
内容投稿：editors@geekbang.com
业务合作：hezuo@geekbang.com
反馈投诉：feedback@geekbang.com
加入我们：zhaopin@geekbang.com
联系电话：010-64738142
地址：北京市朝阳区望京北路9号2幢7层A701
InfoQ 近期会议
北京 · QCon全球软件开发大会 2024.4.18-20
北京 · AICon 全球人工智能与大模型应用峰会 2024.5.17-18
深圳 · ArchSummit全球架构师峰会 2024.6.14-15
上海 · FCon全球金融科技大会 2024.8.16-17
全球 InfoQ
InfoQ En
InfoQ Jp
InfoQ Fr
InfoQ Br

创作场景

Facebook 转向神经网络机器翻译（NMT）

评论

从人工分析到智能分析，流量分析如何快速上手？

通用池化框架commons-pool2功能拓展

性能优化 - 伪共享

软件测试/测试开发 | 如何使用代理配置快速定位接口测试脚本问题？

C++ 引用：他是坤坤也是鸡哥

Verilog HDL门级建模

细胞分裂问题的原创解法

程序员培训班哪家教的比较好

Java编程培训中心怎么样呢

CBM业务模型是什么和为什么？

设计消息队列存储消息数据的 MySQL 表格

C++ const与指针

NodeJS 实战系列：如何设计 try catch

数据可视化图表系列解析——瀑布图

运维训练营第十二课作业

一文揭晓，我是如何在Linux中查找自如

架构实战营4.3 存储分片分区架构随堂练习

nCompass为医疗行业信息安全穿上“铠甲”

深度学习快速上手——基于 MegEngine 的 LeNet 快速训练与部署

软件测试/测试开发 | 接口自动化测试如何进行认证？

web前端线下培训学习靠谱吗？

WEB前端编程培训靠谱吗？

Source Map 原理

聚焦低碳发电，践行“双碳”之路

技术升级落地需要天时、地利、人和

架构实战营4.2 存储复制架构随堂练习

Perfkit - 性能分析与测量工具集

C++ Lambda表达式

大数据培训课程靠谱吗？

性能优化 - 访问局部性

可观测性之网站性能调优的实际案例-小白都看的懂

创作场景

Facebook 转向神经网络机器翻译（NMT）

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载