大厂Data+Agent 秘籍:腾讯/阿里/字节解析如何提升数据分析智能。 了解详情
写点什么

阿里国际发布首个大规模商用翻译大模型,效果据称超 Google、DeepL 等

  • 2024-10-17
    北京
  • 本文字数:793 字

    阅读完需:约 3 分钟

大小:394.50K时长:02:14
阿里国际发布首个大规模商用翻译大模型,效果据称超Google、DeepL等

在 AI 调用量最高的场景之一——机器翻译,阿里国际的 AI 团队有了新进展。


10 月 16 日,阿里国际副总裁、AI 负责人张凯夫在接受彭博社专访时表示,阿里国际最新研发的 Marco 翻译大模型,支持中、英、日、韩、西、法等 15 种全球主流语种。目前已在阿里国际 AI 官网 Aidge 上发布,面向全球用户开放使用。


据称,基于目前广泛使用的开源评测数据集 Flores,Marco 翻译大模型在 BLEU 自动评测指标上,超过市面上的其他翻译产品,如 Google 翻译、DeepL、GPT-4 等。



图:根据公开榜单数据的测评结果


Marco 的主要优势就是由大语言模型驱动,能够基于语境进行精准翻译,而不是根据字面意思,造成哭笑不得的歧义。“你的宝贝正在路上”,不会再被翻译成“Your baby is on the way”。以“尊嘟喜欢”这一网络用语为例,一些 AI 翻译产品会将这句话翻译为“Zundu likes it”,而在 Marco 大模型中,这句话非常地道地翻译为“I really like it”。


如何实现这一效果呢?据介绍,Marco 翻译大模型通过面向多语言的数据筛选技术,如多语种混合语料甄别、多维度数据质量评估,获得高质量、大规模的多语言数据,再结合多语言的混合专家、参数扩张方法,从而保证主导语言(如中、英)性能不下降的情况下,提升其他语种的质量。同时,通过模型量化和加速、多模型规约等优化策略,大幅降低大模型的服务成本,甚至与传统小模型相比,成本也具有优势。


目前,Marco 翻译大模型已实现大规模商用。得益于阿里国际在跨境电商领域多年的积累,Marco 在跨境电商领域的表现尤为亮眼。对于个人用户来说,Marco 能够根据上下文提供高质量的翻译和良好的可读性,甚至支持不同的翻译风格,满足多样化的翻译需求。


根据媒体公开报道,阿里国际在去年成立了 AI 团队,过去一年在 40 多个场景里测试了 AI 能力,帮助 50 万中小商家、对 1 亿款商品进行优化。商家的 AI 需求也不断增长,近半年的数据显示,平均每两个月,商家对于 AI 的调用量就翻 1 倍,AI 的调用量已经突破日均 1 亿次。

2024-10-17 08:4911120

评论

发布
暂无评论
发现更多内容

Android客户端网络预连接优化机制探究

vivo互联网技术

android TCP HTTP

深入了解Spring框架之WebMVC框架

邱学喆

spring webmvc HandlerMethod HandlerInterceptor

【融云技术】Native C/C++ 服务适配多指令集 CPU 漫谈

融云 RongCloud

项目进度管理 | 如何为项目制定里程碑?

万事ONES

项目管理 研发管理 研发管理工具 ONES

商用RTC vs 基于开源WebRTC自研 开发者该如何选择?

融云 RongCloud

清晰理解红黑树的演变---红黑的含义

hasWhere

最牛的编码套路

hasWhere

EasyRecovery---U盘数据恢复技巧

淋雨

数据恢复 EasyRecovery 文件恢复

150亿美元,CANVA可画市场价值为何堪比金蝶、用友?

ToB行业头条

SaaS 可画 品牌视觉管理

「SQL数据分析系列」5. 多表查询

Databri_AI

数据库 sql 查询语句

还不会JVM调优吗?照着做就行

看山

Java JVM 6月日更

【Flutter 专题】102 何为 Flutter RenderObjects ?

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 6月日更

react源码解析14.手写hooks

全栈潇晨

React

盘点用jQuery框架实现“for循环”的四种方式!

华为云开发者联盟

jquery 遍历 js 框架 for循环

一文介绍备机重建各种方法的实现机制

华为云开发者联盟

主机 集群 GaussDB(DWS) 备机重建 备机

网络攻防学习笔记 Day46

穿过生命散发芬芳

网络攻防 6月日更

短链接生成算法

Skysper

算法

烹饪一道美味的 CLI

蛋先生DX

node,js command 6月日更

WinRM 如何设置 TrustedHosts

HoneyMoose

你真的会设置密码吗?

卢卡多多

密码学 6月日更

云图说|初识华为云数据库GaussDB(for openGauss)

华为云开发者联盟

数据库 开源 GaussDB GaussDB(for openGauss) 华为云数据库

什么是 API

escray

学习 极客时间 朱赟的技术管理课 6月日更

SpringBoot之ScopedProxyMode

梦倚栏杆

Redis响应延时问题排查

hasWhere

我想挑战下我的软肋,动手实现个Spring应用上下文!

小傅哥

spring 应用上下文 资源加载 自动识别 扩展机制

优秀的 Scrum Master 应当是仆人式的领导

万事ONES

Scrum 敏捷开发 ScrumMaster ONES

警惕商标到付快递的骗局

石云升

商标 诈骗 6月日更

Python——字典的遍历

在即

6月日更

图论环境配置出现的各种错误

容光

【Vue2.x 源码学习】第十六篇 - 生成 render 函数 - 代码拼接

Brave

源码 vue2 6月日更

负载均衡算法之二 - 以 Golang 方式

hedzr

Go 语言 load-balancing weighted random weighted versioning

阿里国际发布首个大规模商用翻译大模型,效果据称超Google、DeepL等_AI&大模型_赵钰莹_InfoQ精选文章