写点什么

微软的汉英机器翻译达到人类水平

  • 2018-03-21
  • 本文字数:896 字

    阅读完需:约 3 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

微软设计了一个翻译算法,把中文句子翻译成英文,其译文达到了人工翻译的水平

长久以来,把中文句子翻译成英文一直是个难题。有些语言和英语的相似度很高,翻译起来比较容易。由于中文的句子结构不同,所以,对于许多传统的翻译算法来说,中文翻译都是一项挑战。借助在过去几年里屡创佳绩的神经机器翻译技术,微软让机器翻译出的句子可以媲美人类翻译出的句子。

微软研究人员在神经机器翻译中使用了两种现有的方法:对偶学习推敲网络。借助对偶学习,系统从中文翻译生成的英文译文会被重新翻译成中文,从而保证结果的意思相同。在人工翻译过程中,为了验证翻译结果的正确性,人类也是这样做的,而机器似乎也得益于这一项技术。推敲网络是一种对生成的句子进行修改的方法。这项技术也是受人类的工作方式所启发:在翻译句子的时候,我们不是立即写下完整的翻译,而是修改再修改,找出最好的一个。

为了改进翻译算法,微软还开发了两项新技术。他们的联合训练技术会把英文句子翻译成中文,然后再译回英文,扩展训练集。两个翻译系统都使用这项技术进行了改进。他们还创建了“一致性原则(agreement regularization)”:他们让两个算法从右向左读取中文句子,然后再从左向右。如果两个算法都给出了相同的翻译,那么这就被视为翻译正确的有力证明。

需要注意,他们达到“媲美人类的里程碑”这一结论是通过双语顾问对比机器翻译和“黄金翻译”得出的。语言翻译评价会对比机器生成的结果和人工翻译给出的单个句子。这种方法的缺点是,没有完美的算法可以比较翻译结果的内在意义,从而确保他们的意思一致。这是所有翻译研究人员都面临的问题,包括谷歌在内,他们选用的算法在算法评价上效果较差,但在人类对比评估方面效果更好。

过去几年来,借助强大的神经网络,机器翻译社区在翻译算法方面取得了大量的成果。谷歌 Facebook 和微软都争相开发最好的算法。微软在这里对比了传统翻译算法和神经翻译算法,但还没有把他们可以媲美人类的系统放在里面。

查看英文原文 Microsoft Achieved Human Parity on Chinese-English Machine Translation

2018-03-21 19:002981
用户头像

发布了 1008 篇内容, 共 439.6 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

Java集合与数据类型

kingcall

Java JAVA集合 Java集合框架 java数据类型

分布式监控平台 WGCLOUD v3.4.2 节流 30%,更轻更快

王逅逅

Linux 信创 zabbix Prometheus #运维 性能监测

部署RDS 服务

我叫于豆豆吖.

11月月更

WSUS 服务

我叫于豆豆吖.

11月月更

2022年中国电商平台市场洞察

易观分析

电商 报告

【愚公系列】2022年11月 微信小程序-应用生命周期和全局变量

愚公搬代码

11月月更

第一章三层交换应用

初学者

网络 11月月更

数据仓库实战教程

kingcall

数据仓库 数据湖 数据安全 数仓 数仓建模

华为云企业交换机ESW,让数据业务无缝迁移上云

爱科技的水月

算法题学习---删除有序链表中重复的元素-II

桑榆

算法题 11月月更

redis 集群实现方案与原理

想要飞的猪

redis哨兵集群 redid集群cluster

Alluxio 2.9新版发布 | 重塑架构,支持大规模多租户环境

Alluxio

分布式 新闻 Alluxio 大数据 开源 数据编排

2022-11-21:第N高的薪水。表结构和数据的sql语句如下。请问sql语句如何写? DROP TABLE IF EXISTS employee; CREATE TABLE employee (

福大大架构师每日一题

数据库 sql 福大大

浅谈中小企业进军新媒体行业为何屡次遭受挫败

石头IT视角

前端食堂技术周刊第 60 期:TypeScript 4.9、Ant Design 5.0、用 vanilla-extract 编写高性能的 CSS、Node.js 安全最佳实践

童欧巴

华为云Astro的前世今生:用7年时间革新低代码开发观念

科技怪授

低代码会使初级码农失业吗

秃头也爱科技

MACH架构的质量工程指南

俞凡

架构 微服务 云原生

【C语言】register 关键字

謓泽

11月月更

DHCP 服务

我叫于豆豆吖.

11月月更

jvm(三)类加载机制、javac编译

想要飞的猪

JVM类加载

【Ajax】全面详细了解git的基础操作【万字教学+面试常客】

坚毅的小解同志

git 11月月更

SpringBoot之用拦截器避免重复请求

okokabcd

Spring Boot

信用卡评测系列——阳光惠生活APP深化服务客户品牌理念,焕新升级7.0版

易观分析

金融 银行 信用卡

鸿蒙系统ARKUI框架对于分布式计算和请求API的实战研究

恒山其若陋兮

前端 11月月更

第二章STP应用配置

初学者

网络 11月月更

真正的按需计费-函数工作流 FunctionGraph实战,5分钟搭建图片压缩应用

秃头也爱科技

解决数据分析落地难的几点经验

穿过生命散发芬芳

数据分析 11月月更

Linux 系统启动过程

芯动大师

Linux Linux驱动 11月月更

跨平台桌面应用开发都有哪些主流框架

FinFish

小程序 跨端框架 桌面端开发 跨端应用开发

API安全设计5A原则

阿泽🧸

11月月更 API安全

微软的汉英机器翻译达到人类水平_AI&大模型_Roland Meertens_InfoQ精选文章