微软的汉英机器翻译达到人类水平_AI&大模型_Roland Meertens_InfoQ精选文章

AICon 深圳站聚焦 Agent 技术、应用与生态，大咖分享实战干货了解详情 



 写点什么

登录/注册

看新闻很累？看技术新闻更累？试试下载 InfoQ 手机客户端，每天上下班路上听新闻，有趣还有料！

微软设计了一个翻译算法，把中文句子翻译成英文，其译文达到了人工翻译的水平。

长久以来，把中文句子翻译成英文一直是个难题。有些语言和英语的相似度很高，翻译起来比较容易。由于中文的句子结构不同，所以，对于许多传统的翻译算法来说，中文翻译都是一项挑战。借助在过去几年里屡创佳绩的神经机器翻译技术，微软让机器翻译出的句子可以媲美人类翻译出的句子。

微软研究人员在神经机器翻译中使用了两种现有的方法：对偶学习和推敲网络。借助对偶学习，系统从中文翻译生成的英文译文会被重新翻译成中文，从而保证结果的意思相同。在人工翻译过程中，为了验证翻译结果的正确性，人类也是这样做的，而机器似乎也得益于这一项技术。推敲网络是一种对生成的句子进行修改的方法。这项技术也是受人类的工作方式所启发：在翻译句子的时候，我们不是立即写下完整的翻译，而是修改再修改，找出最好的一个。

为了改进翻译算法，微软还开发了两项新技术。他们的联合训练技术会把英文句子翻译成中文，然后再译回英文，扩展训练集。两个翻译系统都使用这项技术进行了改进。他们还创建了“一致性原则（agreement regularization）”：他们让两个算法从右向左读取中文句子，然后再从左向右。如果两个算法都给出了相同的翻译，那么这就被视为翻译正确的有力证明。

需要注意，他们达到“媲美人类的里程碑”这一结论是通过双语顾问对比机器翻译和“黄金翻译”得出的。语言翻译评价会对比机器生成的结果和人工翻译给出的单个句子。这种方法的缺点是，没有完美的算法可以比较翻译结果的内在意义，从而确保他们的意思一致。这是所有翻译研究人员都面临的问题，包括谷歌在内，他们选用的算法在算法评价上效果较差，但在人类对比评估方面效果更好。

过去几年来，借助强大的神经网络，机器翻译社区在翻译算法方面取得了大量的成果。谷歌、 Facebook 和微软都争相开发最好的算法。微软在这里对比了传统翻译算法和神经翻译算法，但还没有把他们可以媲美人类的系统放在里面。

查看英文原文： Microsoft Achieved Human Parity on Chinese-English Machine Translation

评论

发布

暂无评论

《Linux就该这么学》PDF版免费下载

喝完可乐桶后程序员回归本源，开源Spring基础内容

Java spring 学习源码面试

框架设计作业

极客时间架构师训练营 1 期 - 第 11 周总结

阿里开源十亿级并发设计手册：数据库+缓存+消息队列+分布式+维护

Java架构追梦

Java 阿里巴巴编程架构亿级流量

ShardingSphere Raw JDBC 主从示例

Java JDBC ShardingSphere

架构师训练营 - 第十一周总结

极客大学架构师训练营

Spring视图解析流程

无用且垂死的星辰

架构师训练营第二周作业

极客大学架构师训练营

那些年，支撑尾款人们熬夜的AI

Mysql Docker 主从配置

MySQL Docker 主从读写

Sharding-Sphere Proxy 分库分表简单示例

Java MySQL 分库分表 ShardingSphere-Proxy

架构师训练营第二周学习心得

DeFi交易所系统APP开发|DeFi交易所软件开发

离开

LeetCode题解：874. 模拟行走机器人，模拟情境，JavaScript，详细注释

算法大前端 LeetCode

架构师养成第二课

架构师训练营第 1 期第11周作业

架构师训练营第七周作业

我膨胀了，测试必要商城小程序，用了3种方式！:)

清菡软件测试

极客时间架构师培训 1 期 - 第 11 周作业

5 千字长文+ 30 张图解 | 陪你手撕 STL 空间配置器源码

程序员贺同学

c++ 源码后端内存 stl

第二周框架设计学习总结

极客大学架构师训练营框架设计

ShardingSphere Proxy 主从读写入门使用

Java 主从读写 ShardingSphere

架构师训练营 - 第十一周作业

极客大学架构师训练营

架构师训练营 -week11-总结

极客大学架构师训练营

月薪8k和月薪38K的程序员差距在哪里？学习Linux C/C++ 这些你就知道了

c++ Linux 程序员 Linux服务器开发 C、C++程序员

架构师训练营第11周课后作业

极客大学架构师训练营

整天都在讨论使用SpringBoot，可你居然连缓存都不清楚

Java 缓存学习面试 springboot

秒懂DHCP是什么

性能压测的时候，随着并发压力的增加，系统响应时间和吞吐量如何变化，为什么？