【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

Google 发布 MultiModel:能够学习不同领域多任务的神经网络

  • 2017-07-19
  • 本文字数:829 字

    阅读完需:约 3 分钟

Google 开发了一种可以接受多种形式输入并能生成多种形式输出的算法。

目前,大部分机器学习应用程序都只能关注一个领域。机器翻译一次只能建立一个语言对的模型,而图像识别算法一次只执行一个任务(例如描述图像、判断图像所属类别或在图像中查找对象)。然而,我们的大脑在执行所有任务时都能表现得很好,并且能够将知识从一个领域转移到另一个领域。大脑甚至可以将通过听学到的知识转换成其他领域的知识:看到或者读到的知识。

Google 开发了一个能够执行8 个不同领域任务的模型:语音识别、图像分类和添加标题、句法解析、英德互译和英法互译。这个模型由编码器、解码器和“输入输出混频器”组成,其中“输入输出混频器”会将先前的输入和输出馈送到解码器。如下图所示,每个“花瓣”表示一种形式(声音、文本或图像)。神经网络可以通过任意一种输入和输出的形式来学习每个任务。

2016 年 11 月,Google 发布了 zero-shot 翻译。该算法将所有句子映射到“中间语言”,“中间语言”指的是一种对于每种输入语言和输出语言都相同的句子。Google 只针对英韩语言对和英日语言对进行了训练,也就是说这个神经网络并未学习过对应的日韩语言对,但这时这个神经网络就能够进行日韩互译了。

Google 报告称,使用 MultiModel 时使用少量训练数据的任务表现更好。机器学习模型通常在使用更多训练数据的时候表现更好。使用 MultiModel 可以从多个领域获取额外的数据。需要注意的是,使用这种方法并没有打破标准任务任何已有的记录。

MultiModel 作为 Tensor2Tensor 库的一部分在 GitHub 开源。有关这个模型更详细的方法和研究结果可以在 arxiv.com 的论文 One Model To Learn Them All 中找到。

查看英文原文: Google Presents MultiModel: A Neural Network Capable of Learning Multiple Tasks in Multiple Domains


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2017-07-19 19:001528
用户头像
蔡芳芳 InfoQ主编

发布了 781 篇内容, 共 494.1 次阅读, 收获喜欢 2748 次。

关注

评论

发布
暂无评论
发现更多内容

SQL 优化及场景实例

Andy

搜索引擎的基本架构

Andy

TiKV 新架构:Partitioned Raft KV 原理解析

PingCAP

MySQL 数据库 TiDB

2023-05-16:给你一个 严格升序排列 的正整数数组 arr 和一个整数 k 。 请你找到这个数组里第 k 个缺失的正整数。 输入:arr = [2,3,4,7,11], k = 5。 输出:9

福大大架构师每日一题

golang 算法 rust

一不小心,穿越到未来银行

白洞计划

银行 生成式AI

BitKeep崛起:千万用户的信任,终点还未到来

EOSdreamer111

C语言编程—数据类型

二哈侠

开源赋能 普惠未来|京东集团寄语2023开放原子全球开源峰会

开放原子开源基金会

浅谈什么是多端能力服务统一

FinFish

前端技术 后端技术 小程序容器 多端能力服务统一 跨端技术

RDB 关系型数据库

Andy

NoSQL 分布式缓存架构

Andy

大数据如何助力营销(3)产品定位

MobTech袤博科技

NoSQL 数据库架构

Andy

INFINI Labs 产品更新 | 重磅推出 Easysearch 一个分布式的近实时搜索与分析引擎

极限实验室

elasticsearch console Gateway agent easysearch

IPP SWAP算力LP挖矿系统搭建开发技术

薇電13242772558

智能合约

浪潮海岳低代码平台inBuilder开源社区版特性推荐系列-第二期

inBuilder低代码平台

开源 低代码

人工智能基础软件助力交通运输智慧执法

九章云极DataCanvas

SQL 问题集合

Andy

2023年5月中国数据库排行榜:OTO组合回归育新机,华为高斯蓄势待发展雄心

墨天轮

数据库 opengauss TiDB oceanbase 国产数据库

一不小心,穿越到未来银行

脑极体

生成式AI

数据标注类相关文章:揭秘数据标注的奥秘

来自四九城儿

得物AI平台-KubeAI推理训练引擎设计和实践

得物技术

分布式架构-锁原语CAS与各类锁

Andy

Session 会话

Andy

玩转 LLMs 之基础设施「利刃出鞘」

Zilliz

Milvus ChatGPT autogpt zillizcloud langchain

文心一言 VS chatgpt (17)-- 算法导论4.1 3~4题

福大大架构师每日一题

ChatGPT 文心一言

BitKeep崛起:千万用户的信任,终点还未到来

股市老人

使用 Easysearch,日志存储少一半

极限实验室

elasticsearch zstd easysearch

火热报名!2023开放原子全球开源峰会报名通道正式开启

开放原子开源基金会

AI数据采集标注类型:揭秘数据采集与标注的关键环节

来自四九城儿

什么是低代码开发?低代码开发可以解决哪些问题?

优秀

低代码开发 低代码开发平台

Google发布MultiModel:能够学习不同领域多任务的神经网络_Google_Roland Meertens_InfoQ精选文章