2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

微软的汉英机器翻译达到人类水平

  • 2018-03-21
  • 本文字数:896 字

    阅读完需:约 3 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

微软设计了一个翻译算法,把中文句子翻译成英文,其译文达到了人工翻译的水平

长久以来,把中文句子翻译成英文一直是个难题。有些语言和英语的相似度很高,翻译起来比较容易。由于中文的句子结构不同,所以,对于许多传统的翻译算法来说,中文翻译都是一项挑战。借助在过去几年里屡创佳绩的神经机器翻译技术,微软让机器翻译出的句子可以媲美人类翻译出的句子。

微软研究人员在神经机器翻译中使用了两种现有的方法:对偶学习推敲网络。借助对偶学习,系统从中文翻译生成的英文译文会被重新翻译成中文,从而保证结果的意思相同。在人工翻译过程中,为了验证翻译结果的正确性,人类也是这样做的,而机器似乎也得益于这一项技术。推敲网络是一种对生成的句子进行修改的方法。这项技术也是受人类的工作方式所启发:在翻译句子的时候,我们不是立即写下完整的翻译,而是修改再修改,找出最好的一个。

为了改进翻译算法,微软还开发了两项新技术。他们的联合训练技术会把英文句子翻译成中文,然后再译回英文,扩展训练集。两个翻译系统都使用这项技术进行了改进。他们还创建了“一致性原则(agreement regularization)”:他们让两个算法从右向左读取中文句子,然后再从左向右。如果两个算法都给出了相同的翻译,那么这就被视为翻译正确的有力证明。

需要注意,他们达到“媲美人类的里程碑”这一结论是通过双语顾问对比机器翻译和“黄金翻译”得出的。语言翻译评价会对比机器生成的结果和人工翻译给出的单个句子。这种方法的缺点是,没有完美的算法可以比较翻译结果的内在意义,从而确保他们的意思一致。这是所有翻译研究人员都面临的问题,包括谷歌在内,他们选用的算法在算法评价上效果较差,但在人类对比评估方面效果更好。

过去几年来,借助强大的神经网络,机器翻译社区在翻译算法方面取得了大量的成果。谷歌 Facebook 和微软都争相开发最好的算法。微软在这里对比了传统翻译算法和神经翻译算法,但还没有把他们可以媲美人类的系统放在里面。

查看英文原文 Microsoft Achieved Human Parity on Chinese-English Machine Translation

2018-03-21 19:003020
用户头像

发布了 1008 篇内容, 共 444.0 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

ChaosBlade:从零开始的混沌工程(二)

郭旭东

云原生 混沌工程

区块链技术如何应用于版权保护?

CECBC

区块链技术 维权 著作权 版权保护 侵权

从软件架构说起

傻傻的帅

架构 架构要素 架构设计原则

架构师训练营-第一周-食堂就餐卡系统设计

Anrika

架构师 极客大学架构师训练营

谈谈阿里云发布新一代容器、Serverless 等云原生产品

关贺宇

阿里云 容器 云原生 中间件

食堂就餐卡系统架构设计

任小龙

《Web全栈实用编程》一书征集意见

老魚

程序员 大前端 Web 后端 全栈

极客大学架构师训练营第一周学习总结

竹森先生

学习 架构设计 极客大学架构师训练营

IT自由职业者是怎么样的感受和体验

古月木易

IT职场

【话题讨论】「世界上最好的语言」?25周岁的 PHP “配” “不配”

InfoQ写作社区官方

php 写作平台 PHP25周年 热门活动

架构师训练营第1周作业二:学习总结

sunpengjian

产品路线图–您的产品战略路径指南

涛哥 数字产品和业务架构

敏捷 产品经理

week1-食堂就餐卡系统设计

不在调上

我们需要干货吗?

Neco.W

能力提升 经验分享 干货

架构师训练营第1周作业一:食堂就餐卡系统设计

sunpengjian

程序员为什么技术这么厉害,赚得钱却不多?

金刚小书童

程序员 职业规划 技术管理

Week01 学习笔记

任小龙

架构师训练营-第一周学习总结

hellohuan

极客大学架构师训练营

架构师训练营第1周_学习总结

方舟勇士

课程总结

基于UML的食堂就餐卡系统设计

王海

极客大学架构师训练营

ZooKeeper核心原理及应用场景

古月木易

第一周课后作业——食堂就餐卡系统概要设计

jiangnanage

设计模式之单件模式

公众号:程序猿成神之路

Java 设计模式

架构训练营第一周学习总结

陈靓-哲露

ZooKeeper核心原理及应用场景

奈学教育

zookeeper

食堂就餐卡系统设计

hellohuan

架构 极客大学架构师训练营

架构师训练营第一周-食堂就餐卡系统设计

王铭铭

食堂就餐卡系统架构设计文档

hifly

极客大学架构师训练营 UML 架构文档 部署图 时序图

极客时间 - 架构师训练营 - week1 - 食堂就餐卡系统设计

毛聪

极客时间 极客大学架构师训练营 食堂就餐卡系统设计

架构师训练营-作业2-学习总结

狂奔嘀兔纸

极客大学架构师训练营

干货|微服务线上生命周期管理

博文视点Broadview

容器 微服务 架构师

微软的汉英机器翻译达到人类水平_AI&大模型_Roland Meertens_InfoQ精选文章