阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

Facebook 公布最新的神经网络机器翻译算法

  • 2017-05-25
  • 本文字数:838 字

    阅读完需:约 3 分钟

Facebook 的人工智能研究团队公布了他们最新的神经网络机器翻译(NMT)研究成果。同时进行三个机器翻译任务,他们的算法比其他任何一个系统的得分都要高,而且比Google 的NMT 系统快上9 倍。

Facebook 使用了卷积神经网络,该技术在计算机视觉领域得到广泛应用。它以一种结构化的顺序来处理句子,捕捉句子成分之间复杂的关系。Facebook 对计算机进行训练,让它们能够识别出句子(由两个、三个、四个或更多的单词组成)各个部分的含义。通过使用神经网络来处理句子,计算机可以理解句子各个部分的含义。然后使用另一种神经网络将这些意思转译成另外一门语言。

卷积的主要优势在于,你可以同时将其应用在句子的多个成分上。传统的NMT 技术逐字地读取句子,然后记下句子在当前位置的意思。计算机的速度限制了串行化读取的速度,结果就是Facebook 的算法可以比串行化读取技术最多快上9 倍。

他们还引入一种新的技术,叫作“multi-hop”。这种技术并不是整句地读取然后整句地翻译,而是进行逐字翻译。multi-hop 是一种新技术,比“专注”(attention)机制更智能、更复杂。专注机制是解决多义词问题的关键。一个单词在不同的上下文里具有不同的含义。在翻译一个单词的时候,专注机制根据原文的相关部分为单词选择最合适的释义,从而解决多义词问题。

Facebook 打算将他们的新技术应用在其他文字处理任务上,比如使用神经网络来回答问题。新技术可以让他们同时专注于对话的每一个部分。他们在博客上完整地介绍了他们的新技术,还有一份可以自由访问的论文。如果有人想尝试他们的算法,可以从 GitHub 下载代码。

在进行英语到法语、英语到德语和英语到罗马尼亚语的翻译时,新算法比其他任何一个算法都要快。它打败了 Google 的神经网络机器翻译技术。 Google Translate SDK 提供了 Google 的翻译算法,可以支持 20 种语言互译组合。如果有人想知道 NMT 和传统技术之间的区别,可以试着使用 Microsoft Translator 来翻译他们喜欢的内容。

查看英文原文: Facebook Publishes New Neural Machine Translation Algorithm

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2017-05-25 19:003140
用户头像

发布了 322 篇内容, 共 134.2 次阅读, 收获喜欢 144 次。

关注

评论

发布
暂无评论
发现更多内容

云原生时代,腾讯如何做好容器安全体系建设?

腾讯安全云鼎实验室

腾讯云 容器

Java操作Office:POI之word生成

程序员架构进阶

Java Apache POI 技术应用 8月日更 代码实战

MQTT-消息传输协议

一个大红包

8月日更

基于 HLS 创建 Golang 视频流服务器

声网

音视频 HLS

一周信创舆情观察(7.26~8.1)

统小信uos

摘下手机赛场的夏季“金牌”,荣耀的“飞人之路”

脑极体

从关门“振动”说起,在这部剧本杀综艺里,爱奇艺隐藏了多少技术“小心机”

爱奇艺技术产品团队

综艺节目 互动视频技术 爱奇艺

趁着课余时间学点Python(五)用课余时间提升自己关于高级数据类型的知识

ベ布小禅

8月日更

外包三年给整废了,备战两月终拿到4家大厂offer,阿里P6+这回稳了

Java架构师迁哥

阿里顶级大佬整理出十六个专题的Java面试指南,金九银十不用愁!

Java 编程 架构 面试 架构师

101道经典JavaScript面试题总结(附答案,建议收藏)

前端依依

面试 大前端 JavaScrip

专访融云 CTO 任杰:构建通信云全能力

融云 RongCloud

字节跳动Android面试:2021Android大厂面试知识分享

欢喜学安卓

android 程序员 面试 移动开发

拍乐云创始人赵加雨:沉浸式音视频加持数智化未来世界

拍乐云Pano

hbase运维故障案例分析

GrowingIO技术专栏

大数据 运维 HBase

如何洞察出推荐的关键时刻

石云升

推荐 用户体验 体验设计 8月日更

getInteger还是getIntValue,这是一个问题

FunTester

Java json Groovy

使用 MVC 架构构建 Flask CRUD 应用程序

DisonTangor

Python flask

这是一次鸡肋的代码审计

网络安全学海

网络安全 信息安全 计算机 渗透测试 安全漏洞

一个算法“拿下”两个榜单!爱奇艺ICCV 2021论文提出人手三维重建新方法

爱奇艺技术产品团队

vr 论文 ICCV2021 高精度三维重建

FastApi-06-请求体-3

Python研究所

FastApi 8月日更

人在年轻的时候,最核心的能力是什么?

非著名程序员

认知提升 个人提升 提升自我 8月日更

资深大牛带你了解源码!最新Android面试题整理

欢喜学安卓

android 程序员 面试 移动开发

中台的前世今生

涛哥 数字产品和业务架构

企业架构 中台架构 中台的由来

架构实战营毕业设计

Saber

架构实战营

现有市值管理机器人|交Y机器人系统源码搭建

Geek_23f0c3

做市机器人 去中心化市值管理机器人

架构实战营模块四作业

maybe

PostgreSQL正强势回归!

数据库 大数据 时序数据库 tsdb 数据智能

使用PyTorch构建神经网络模型进行手写识别

Shirakawa

神经网络 机器学习 深度学习 PyTorch 手写识别

贝壳找房基于StarRocks构建全新统一的极速OLAP平台实践

StarRocks

数据库 数据分析 OLAP StarRocks

强推!华为内部都在用的783页大数据处理系统:Hadoop源代码pdf

Java 编程 架构 面试 架构师

Facebook公布最新的神经网络机器翻译算法_Meta_Roland Meertens_InfoQ精选文章