大咖直播-鸿蒙原生开发与智能提效实战!>>> 了解详情
写点什么

阿里国际发布首个大规模商用翻译大模型,效果据称超 Google、DeepL 等

  • 2024-10-17
    北京
  • 本文字数:793 字

    阅读完需:约 3 分钟

大小:394.50K时长:02:14
阿里国际发布首个大规模商用翻译大模型,效果据称超Google、DeepL等

在 AI 调用量最高的场景之一——机器翻译,阿里国际的 AI 团队有了新进展。


10 月 16 日,阿里国际副总裁、AI 负责人张凯夫在接受彭博社专访时表示,阿里国际最新研发的 Marco 翻译大模型,支持中、英、日、韩、西、法等 15 种全球主流语种。目前已在阿里国际 AI 官网 Aidge 上发布,面向全球用户开放使用。


据称,基于目前广泛使用的开源评测数据集 Flores,Marco 翻译大模型在 BLEU 自动评测指标上,超过市面上的其他翻译产品,如 Google 翻译、DeepL、GPT-4 等。



图:根据公开榜单数据的测评结果


Marco 的主要优势就是由大语言模型驱动,能够基于语境进行精准翻译,而不是根据字面意思,造成哭笑不得的歧义。“你的宝贝正在路上”,不会再被翻译成“Your baby is on the way”。以“尊嘟喜欢”这一网络用语为例,一些 AI 翻译产品会将这句话翻译为“Zundu likes it”,而在 Marco 大模型中,这句话非常地道地翻译为“I really like it”。


如何实现这一效果呢?据介绍,Marco 翻译大模型通过面向多语言的数据筛选技术,如多语种混合语料甄别、多维度数据质量评估,获得高质量、大规模的多语言数据,再结合多语言的混合专家、参数扩张方法,从而保证主导语言(如中、英)性能不下降的情况下,提升其他语种的质量。同时,通过模型量化和加速、多模型规约等优化策略,大幅降低大模型的服务成本,甚至与传统小模型相比,成本也具有优势。


目前,Marco 翻译大模型已实现大规模商用。得益于阿里国际在跨境电商领域多年的积累,Marco 在跨境电商领域的表现尤为亮眼。对于个人用户来说,Marco 能够根据上下文提供高质量的翻译和良好的可读性,甚至支持不同的翻译风格,满足多样化的翻译需求。


根据媒体公开报道,阿里国际在去年成立了 AI 团队,过去一年在 40 多个场景里测试了 AI 能力,帮助 50 万中小商家、对 1 亿款商品进行优化。商家的 AI 需求也不断增长,近半年的数据显示,平均每两个月,商家对于 AI 的调用量就翻 1 倍,AI 的调用量已经突破日均 1 亿次。

2024-10-17 08:4911369

评论

发布
暂无评论
发现更多内容

MySQL基础之十一:创建表

打工人!

MySQL 6月日更

HTTP 长连接和短连接

看山

TCP/IP HTTP协议 6月日更

JAVA设计模式系列--单例模式

加百利

Java 后端 设计模式 单例模式 6月日更

Single-Spa构建第一个微前端项目

devpoint

Vue 大前端 6月日更

HarmonyOS的万里长征和万里长城

脑极体

【通俗易懂】虚拟DOM,如何更高效DIFF

蛋先生DX

Diff 6月日更

未来,能源枯竭可以逆转吗?

白洞计划

【Flutter 专题】105 图解自定义 ACEPageMenu 滑动菜单 (一)

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 6月日更

【LeetCode】第一个错误的版本Java题解

Albert

算法 LeetCode 6月日更

五种服务部署升级策略,你也许会用的到

架构精进之路

6月日更 服务升级

架构实战营 - 模块 6- 作业

请弄脏我的身体

架构实战营

Git 各指令的本质,真是通俗易懂啊

xcbeyond

6月日更

策略模式怎么玩?

卢卡多多

设计模式 策略模式 6月日更

架构师实战营 模块六作业(拆分电商系统为微服务)

代廉洁

架构实战营

架构师实战营 模块六总结

代廉洁

TempDB 的使用和性能问题

悟空聊架构

sql 性能调优 6月日更 TempDB

模块六作业 - 拆分电商系统为微服务

张大彪

【Vue2.x 源码学习】第十二篇 - 生成 ast 语法树-流程说明

Brave

源码 vue2 6月日更

网络攻防学习笔记 Day43

穿过生命散发芬芳

网络攻防 6月日更

未来,能源枯竭可以逆转吗?

脑极体

SpringCloud Gateway 路由数量对性能的影响研究

黄仲辉

性能优化 动态路由 SpringCloud Gateway JMH性能基准测试

架构实战营-作业六

大可

并发王者课-黄金2:行稳致远-如何让你的线程免于死锁

MetaThoughts

Java 多线程 并发

nacos配置中心模块详解

捉虫大师

nacos 配置中心

话题讨论|如何看待腾讯试点强制6点下班

石云升

话题讨论 加班文化 6月日更

Python——数值列表

在即

6月日更

中国数字化转型为全球带来机遇

CECBC

【音视频】基于声网的多人视频通话功能建设

轻口味

android 音视频 IM 声网

Scrum Patterns : MetaScrum(译)

Bruce Talk

敏捷开发 译文 Agile Scrum Patterns

SpringCloud Gateway 路由转发性能优化

黄仲辉

性能优化 动态路由 SpringCloud Gateway JMH性能基准测试

Java语言概述以及环境搭建

若尘

java编程 6月日更

阿里国际发布首个大规模商用翻译大模型,效果据称超Google、DeepL等_AI&大模型_赵钰莹_InfoQ精选文章