写点什么

微软的汉英机器翻译达到人类水平

  • 2018-03-21
  • 本文字数:896 字

    阅读完需:约 3 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

微软设计了一个翻译算法,把中文句子翻译成英文,其译文达到了人工翻译的水平

长久以来,把中文句子翻译成英文一直是个难题。有些语言和英语的相似度很高,翻译起来比较容易。由于中文的句子结构不同,所以,对于许多传统的翻译算法来说,中文翻译都是一项挑战。借助在过去几年里屡创佳绩的神经机器翻译技术,微软让机器翻译出的句子可以媲美人类翻译出的句子。

微软研究人员在神经机器翻译中使用了两种现有的方法:对偶学习推敲网络。借助对偶学习,系统从中文翻译生成的英文译文会被重新翻译成中文,从而保证结果的意思相同。在人工翻译过程中,为了验证翻译结果的正确性,人类也是这样做的,而机器似乎也得益于这一项技术。推敲网络是一种对生成的句子进行修改的方法。这项技术也是受人类的工作方式所启发:在翻译句子的时候,我们不是立即写下完整的翻译,而是修改再修改,找出最好的一个。

为了改进翻译算法,微软还开发了两项新技术。他们的联合训练技术会把英文句子翻译成中文,然后再译回英文,扩展训练集。两个翻译系统都使用这项技术进行了改进。他们还创建了“一致性原则(agreement regularization)”:他们让两个算法从右向左读取中文句子,然后再从左向右。如果两个算法都给出了相同的翻译,那么这就被视为翻译正确的有力证明。

需要注意,他们达到“媲美人类的里程碑”这一结论是通过双语顾问对比机器翻译和“黄金翻译”得出的。语言翻译评价会对比机器生成的结果和人工翻译给出的单个句子。这种方法的缺点是,没有完美的算法可以比较翻译结果的内在意义,从而确保他们的意思一致。这是所有翻译研究人员都面临的问题,包括谷歌在内,他们选用的算法在算法评价上效果较差,但在人类对比评估方面效果更好。

过去几年来,借助强大的神经网络,机器翻译社区在翻译算法方面取得了大量的成果。谷歌 Facebook 和微软都争相开发最好的算法。微软在这里对比了传统翻译算法和神经翻译算法,但还没有把他们可以媲美人类的系统放在里面。

查看英文原文 Microsoft Achieved Human Parity on Chinese-English Machine Translation

2018-03-21 19:003066
用户头像

发布了 1008 篇内容, 共 448.6 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

展位预定倒计时!500+企业云集,西部不容错过的电子行业盛会

AIOTE智博会

电子展 电子信息展 成都电子展 西部电子展

Microchip扩展连接、存储与计算产品组合,以满足AI数据中心应用日益增长的需求

新消费日报

天翼云牵头编制国家标准,共建行业技术标杆!

天翼云开发者社区

云计算 科学计算 智能计算 天翼云

鸿蒙开发:基于ArkUI的儿童早教钢琴应用实现

chengxujianke

为什么政府单位、事业单位要用自己的内网即时通讯软件?

BeeWorks

即时通讯 IM

AI-Ready TapData:如何基于 MCP 协构建企业级 AI 实时数据中枢?(含教程)

tapdata

实时数据平台 MCP协议 AI+数据 AI数据调用 企业数据中枢

AI技术在英语口语学习中的应用

北京木奇移动技术有限公司

软件外包公司 AI口语练习 AI英语学习

一文快速了解 YMatrix 与 Greenplum 的相同与不同

YMatrix 超融合数据库

数据库 greenplum 迁移数据 YMatrix

赛博威 AI Agent 赋能营销费用管理,实现自主感知、决策与高效行动

赛博威科技

AI 数字营销 AI Agent 赛博威

浅谈企业应用中台的构建

天翼云开发者社区

企业应用中台

告别静态UI!Guineration用AI打造用户专属动态界面

鼎道智联

破局多语之邦,如何让AI听懂印度方言?

数据堂

人工智能 AI 数据 印度 印度互联网

鸿蒙开发:ArkUI实现兴趣社群聊天界面

chengxujianke

性能王者!天翼云再次拿下世界第一

天翼云开发者社区

云平台 算力 天翼云

HDD•鸿蒙赋能交流会模式升级!“培训+班级”开启长效学习进阶之路

最新动态

HarmonyOS NEXT 中级开发笔记:动漫社团社交应用的ArkUI实践

chengxujianke

鸿蒙运动开发:计算户外运动步频与步幅,与地图路线绘制

王二蛋和他的张大花

鸿蒙 os

企业级AI搜索解决方案:阿里云AI搜索开放平台

阿里云大数据AI技术

云计算 大数据 阿里云 信息搜集 AI 搜索引擎

萨科微宋仕强,在人工智能Ai大模型文本写作的试用与反思!

科技汇

【CodeBuddy】三分钟开发一个实用小功能之:九宫格图片切割&生成器

jimaks

CSS

玩转C++11多线程:让你的程序飞起来的std::thread终极指南

电子尖叫食人鱼

C#

鸿蒙开发:ArkUI实现儿童早教应用交互界面

chengxujianke

【FAQ】HarmonyOS SDK 闭源开放能力 —Live View Kit (3)

HarmonyOS SDK

harmoyos

AI 正以颠覆性力量重塑商品管理的底层逻辑

第七在线

AI赋能,赛博威「营销+上市+产品」三线并行产品创新协同平台加速爆品上市!

赛博威科技

数字营销 赛博威 产品创新协同平台

前端热更新:无声革命重构中国互联网开发模式

xuyinyin

SQL Server 2025 - 从本地到云端的 AI 就绪企业数据库

sysin

SQL Server

浪潮海岳inSuite 5.0标准版重磅发布,赋能中小企业数智化转型再提速

浪潮海岳inSuite

比特币BTC是对草根最友好的加密资产,大胆持有,坚定抄底!

区块链项目一站式包装孵化

Kmesh v1.1.0 正式发布!官网焕新升级

华为云原生团队

云计算 容器 云原生

边缘云特点、应用实践和发展趋势浅析

天翼云开发者社区

边缘云 天翼云

微软的汉英机器翻译达到人类水平_AI&大模型_Roland Meertens_InfoQ精选文章