10月21日,杭州云栖大会-技术&可持续发展论坛,注册有礼 了解详情
写点什么

谷歌搜索引入多任务统一模型 MUM,可更准确理解信息 | Google I/O 2021

2021 年 5 月 20 日

谷歌搜索引入多任务统一模型MUM,可更准确理解信息 | Google I/O 2021

美国时间 5 月 18 日,Google I/O 2021开发者大会正式开幕。去年,该会议因疫情取消,今年重新恢复并采用全程线上的形式,对所有开发者免费开放。在刚刚结束的主题演讲中,谷歌发布了 TPU V4 人工智能芯片、自然语言平台 LaMDA 以及一系列原有产品的更新升级。本文,我们将详细介绍谷歌搜索引入的多任务统一模型 MUM。


每天都有很多人使用谷歌来处理需要多步骤的各种任务,而人们在处理类似的复杂任务时平均会发出 8 个查询。如今,搜索引擎还没有成熟到可以像专家一样回答问题。但随着“多任务统一模型”(Multitask Unified Model,MUM)的出现,谷歌正在帮助解决这类复杂需求。因此,未来只需要较少的搜索就可以完成任务。

 

BERT 一样,MUM 同样基于 Transformer 架构,但是它的功能要强大 1000 倍。MUM 不仅可以理解语言,而且可以生成语言。MUM 同时用 75 种不同的语言进行了多项任务的训练,使其比以前的模型更全面地理解信息和世界知识。此外,MUM 是多模态的,因此它能够理解文本和图像中的信息,将来,还可以扩展到视频和音频等更多模态。

 

以徒步富士山的问题为例:MUM 可以理解你在比较两座山,因此海拔高度和路径信息可能是相关的。它还可以理解,就远足而言,“准备工作”可能包括诸如健身训练以及寻找合适的装备。


因为 MUM 能够基于其对这个世界的深刻理解来展现自己的见解,所以它可以强调,尽管两座山的海拔高度大致相同,但秋季是富士山的雨季,你可能需要一件防水夹克。MUM 也能为更深层次的探索提供有用的副主题:比如顶级装备或最佳训练练习,并提供一些网络上有用的文章、视频和图片的链接。


消除语言障碍

 

在获取信息时,语言可能是一个重要障碍。通过不同语言的知识迁移,MUM 有可能打破这些界限。它可以从那些不是用你的搜索语言写成的资料中学习,并且能帮助把这些相关信息发给你。

 

假设有一些关于富士山真正有用的信息是用日语写的;现在,如果你不用日语搜索,你很可能无法找到这些信息。然而,MUM 可以从不同语言的来源中迁移知识,并利用这些洞察力发现与你的首选语言最相关的结果。所以,在将来,当你搜索有关远足富士山的信息时,你可能会看到这样的结果:在何处能欣赏到富士山最美的风景、当地的温泉,以及受欢迎的纪念品商店……这些信息很容易用日语搜索就能找到。

 


理解不同类型的信息

 

多模态的 MUM 意味着它能够同时理解来自不同格式的信息,比如网页、图片等等。最终,你可能会拍一张登山靴的照片,然后问:“我能用它去爬富士山吗?”MUM 将会理解这张图片,并把它和你的问题联系在一起,让你知道你的靴子会很好用。之后,它会给你发一个博客网址,上面有推荐的装备列表。


带着负责的态度把高级人工智能运用到搜索中

 

无论何时,当我们使用人工智能来使世界上的信息更容易获取时,我们都要负责任地这样做。对于谷歌搜索的每一项改进,我们都会进行严格的评估,以确保我们能提供更加相关和有用的结果。那些遵循我们《搜索质量评分准则》(Search Quality Rater Guidelines)的人类评分者,帮助我们了解我们的结果如何帮助人们找到信息。

 

就像我们已经仔细测试了 BERT 从 2019 年开始推出的许多应用一样, MUM 也会经历同样的过程,将这些模型应用于搜索。具体地说,为了避免在我们的系统中引入偏见,我们将寻找可能显示机器学习中偏见的模式。同时,我们也会运用最新的研究成果,比如如何减少 MUM 等训练系统的碳足迹,以确保搜寻工作尽可能高效。

 

今后数月甚至数年,我们将把 MUM 驱动的功能和改进带到我们的产品中。虽然我们仍处在 MUM 探索的初期,但这是一个重要的里程碑,将来谷歌能够理解人们自然地交流和解释信息的各种方式。

 

作者介绍:

 

Pandu Nayak,谷歌研究员兼搜索部门副总裁。

 

原文链接:

 

https://blog.google/products/search/introducing-mum/

2021 年 5 月 20 日 10:441661

评论

发布
暂无评论
发现更多内容

《鸿蒙理论知识06》HarmonyOS概述之应用开发基础知识

孙叫兽

鸿蒙 鸿蒙系统 鸿蒙OS 领航计划

计划会议要开始了,产品负责人却没来…

华为云开发者社区

Scrum PO 开发团队 计划会议 Sprint

数据中心建设很复杂,但选择却能很简单:华为数据中心的多维创新

Geek_459987

【上汽零束SOA】云管端一体化SOA软件平台系列介绍之五:服务实现篇

SOA开发者

软件 SOA

如何将外连接向内连接转换?

华为云开发者社区

sql 数仓 GaussDB(DWS) 外连接 内连接

Opus从入门到精通(二):编解码器使用

轻口味

android 音视频 编解码 9月日更

3年才能驾驭新技术,不如试试这个低代码魔方

华为云开发者社区

低代码 开发 华为云应用魔方 应用程序 魔方

Togaf的认证指南

企业架构知识体系

企业架构 TOGAF

架构实战课程 模块三作业

Frank

netty系列之:在netty中处理CORS

程序那些事

Java Netty 程序那些事 响应式系统

Python——静态方法与类方法、类的导入

在即

9月日更

Arbitrum大跌眼镜?Pledge Finance指明DeFi路在何方

区块链小八歌

Vue进阶(幺幺玖):element-ui table组件适应性问题(横向滚动条)

No Silver Bullet

Vue 9月日更

模块3-作业

笑看风雨情

云原生时代,你真的懂Docker和LXC的区别吗?

云原生开发者社区

Docker 容器 微服务 云原生 LXC

Canal Admin 高可用集群使用教程

Se7en

部门经理竞聘报告PPT模板-优页文档

momo

模板 优页文档 优页文档PPT模板

【上汽零束SOA】云管端一体化SOA软件平台系列介绍之五:服务实现篇

SOA开发者平台

软件 车联网 物联网 汽车

Arbitrum大跌眼镜?Pledge Finance指明DeFi路在何方

股市老人币圈新

乘着汽车智能化的浪潮,“汽车人”职业方向的选择(一)

SOA开发者

软件 职业成长 汽车

《鸿蒙理论知识04》HarmonyOS概述之系统定义

孙叫兽

鸿蒙 鸿蒙系统 领航计划

28分钟完成一款Python游戏,《客服戏翻总裁牌》

梦想橡皮擦

9月日更

简单聊聊汽车OTA给OEM和Tire1带来的变化

SOA开发者

程序员 职业成长 汽车

百度智慧输入,会是企业降本增效的“新生产力”吗?

ToB行业头条

百度 企业服务 百度输入法

《鸿蒙理论知识05》HarmonyOS概述之下载与安装软件

孙叫兽

鸿蒙 鸿蒙系统 领航计划

MapReduce 示例:减少 Hadoop MapReduce 中的侧连接

华为云开发者社区

hadoop mapreduce 排序 侧连接 联接

穿越时空,跟我一起探索云栖数字谷(2021云栖大会免费送票)

阿里云视频云

人工智能 云计算 阿里云 行业资讯 视频云

北京大学医疗科技风论文答辩PPT模板-优页文档

momo

PT模板 优页文档

商务礼仪培训PPT模板-优页文档

momo

免费PPT模板 优页文档

分布式系统中协调和复制技术的原理

博文视点Broadview

Apollo 配置中心详细教程

牧小农

Apollo 阿波罗

数据cool谈(第1期)数据库寻路,开源有态度

数据cool谈(第1期)数据库寻路,开源有态度

谷歌搜索引入多任务统一模型MUM,可更准确理解信息 | Google I/O 2021-InfoQ