写点什么

谷歌搜索引入多任务统一模型 MUM,可更准确理解信息 | Google I/O 2021

  • 2021 年 5 月 20 日
  • 本文字数:1537 字

    阅读完需:约 5 分钟

谷歌搜索引入多任务统一模型MUM,可更准确理解信息 | Google I/O 2021

美国时间 5 月 18 日,Google I/O 2021开发者大会正式开幕。去年,该会议因疫情取消,今年重新恢复并采用全程线上的形式,对所有开发者免费开放。在刚刚结束的主题演讲中,谷歌发布了 TPU V4 人工智能芯片、自然语言平台 LaMDA 以及一系列原有产品的更新升级。本文,我们将详细介绍谷歌搜索引入的多任务统一模型 MUM。


每天都有很多人使用谷歌来处理需要多步骤的各种任务,而人们在处理类似的复杂任务时平均会发出 8 个查询。如今,搜索引擎还没有成熟到可以像专家一样回答问题。但随着“多任务统一模型”(Multitask Unified Model,MUM)的出现,谷歌正在帮助解决这类复杂需求。因此,未来只需要较少的搜索就可以完成任务。

 

BERT 一样,MUM 同样基于 Transformer 架构,但是它的功能要强大 1000 倍。MUM 不仅可以理解语言,而且可以生成语言。MUM 同时用 75 种不同的语言进行了多项任务的训练,使其比以前的模型更全面地理解信息和世界知识。此外,MUM 是多模态的,因此它能够理解文本和图像中的信息,将来,还可以扩展到视频和音频等更多模态。

 

以徒步富士山的问题为例:MUM 可以理解你在比较两座山,因此海拔高度和路径信息可能是相关的。它还可以理解,就远足而言,“准备工作”可能包括诸如健身训练以及寻找合适的装备。


因为 MUM 能够基于其对这个世界的深刻理解来展现自己的见解,所以它可以强调,尽管两座山的海拔高度大致相同,但秋季是富士山的雨季,你可能需要一件防水夹克。MUM 也能为更深层次的探索提供有用的副主题:比如顶级装备或最佳训练练习,并提供一些网络上有用的文章、视频和图片的链接。


消除语言障碍

 

在获取信息时,语言可能是一个重要障碍。通过不同语言的知识迁移,MUM 有可能打破这些界限。它可以从那些不是用你的搜索语言写成的资料中学习,并且能帮助把这些相关信息发给你。

 

假设有一些关于富士山真正有用的信息是用日语写的;现在,如果你不用日语搜索,你很可能无法找到这些信息。然而,MUM 可以从不同语言的来源中迁移知识,并利用这些洞察力发现与你的首选语言最相关的结果。所以,在将来,当你搜索有关远足富士山的信息时,你可能会看到这样的结果:在何处能欣赏到富士山最美的风景、当地的温泉,以及受欢迎的纪念品商店……这些信息很容易用日语搜索就能找到。

 


理解不同类型的信息

 

多模态的 MUM 意味着它能够同时理解来自不同格式的信息,比如网页、图片等等。最终,你可能会拍一张登山靴的照片,然后问:“我能用它去爬富士山吗?”MUM 将会理解这张图片,并把它和你的问题联系在一起,让你知道你的靴子会很好用。之后,它会给你发一个博客网址,上面有推荐的装备列表。


带着负责的态度把高级人工智能运用到搜索中

 

无论何时,当我们使用人工智能来使世界上的信息更容易获取时,我们都要负责任地这样做。对于谷歌搜索的每一项改进,我们都会进行严格的评估,以确保我们能提供更加相关和有用的结果。那些遵循我们《搜索质量评分准则》(Search Quality Rater Guidelines)的人类评分者,帮助我们了解我们的结果如何帮助人们找到信息。

 

就像我们已经仔细测试了 BERT 从 2019 年开始推出的许多应用一样, MUM 也会经历同样的过程,将这些模型应用于搜索。具体地说,为了避免在我们的系统中引入偏见,我们将寻找可能显示机器学习中偏见的模式。同时,我们也会运用最新的研究成果,比如如何减少 MUM 等训练系统的碳足迹,以确保搜寻工作尽可能高效。

 

今后数月甚至数年,我们将把 MUM 驱动的功能和改进带到我们的产品中。虽然我们仍处在 MUM 探索的初期,但这是一个重要的里程碑,将来谷歌能够理解人们自然地交流和解释信息的各种方式。

 

作者介绍:

 

Pandu Nayak,谷歌研究员兼搜索部门副总裁。

 

原文链接:

 

https://blog.google/products/search/introducing-mum/

2021 年 5 月 20 日 10:441833

评论

发布
暂无评论
发现更多内容

Moviepy音视频剪辑:黑白视频的帧图像格式探究

老猿Python

Python 音视频 图像处理 引航计划 Moviepy视频剪辑处理

☕️【Java专题系列】「回顾RateLimiter」针对于限流器的入门到精通(含实战和算法原理介绍)

浩宇天尚

限流算法 Guava 9月日更 Gatelimitor

欧美风个人简历自我介绍PPT模板-优页文档

momo

免费PPT模板 优页文档

新年计划PPT模板-优页文档

momo

模板 优页文档 优页文档PPT模板

网络攻防学习笔记 Day139

穿过生命散发芬芳

9月日更 网站安全基础

医疗保健服务宣传和医疗咨询服务PPT模板-优页文档

momo

PT模板 优页文档 优页文档PPT模板

JavaScript 进阶(二)下下之深浅拷贝

Augus

JavaScript 9月日更

9月23日Atlassian大中华区用户大会20+位重磅嘉宾,15+场干货演讲大放送!

Atlassian

DevOps 敏捷 Jira ITSM Confluence

在线JSON转GraphQL工具

入门小站

工具

JVM内存模型学习笔记(一)

风翱

9月日更 JVM内存模型

为什么渗透提权这么难

网络安全学海

php 网络安全 信息安全 渗透测试 安全漏洞

求助

IT蜗壳-Tango

9月日更

linux之rpm命令

入门小站

Linux

非科班程序员求职经历分享,Java面试知识点

Java 程序员 后端

“盘古”走向产业山峦,打开了一串AI落地的新脑洞

脑极体

什么是主数据

奔向架构师

主数据 9月日更

消息队列存储消息数据的 MySQL 表格设计

tjudream

数据库 索引 消息队列 架构训练营 表结构设计

年终总结誓师大会PPT模板-优页文档

momo

模板 优页文档

护士礼仪培训PPT模板-优页文档

momo

模板 PT模板 优页文档

5 分钟,使用内网穿透快速实现远程桌面

星安果

内网穿透 Frp 远程控制

关于微服务系统中数据一致性的总结

看山

微服务 后端 数据一致性 引航计划 数据自洽

一种优于gzip的压缩方式Brotli

devpoint

9月日更 gzip Brotli

Golang 入门指南

baiyutang

编程 程序员 Go 语言 9月日更

近期焦虑有感

Nydia

【Flutter 专题】43 图解 Flutter 适配 AndroidX

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 9月日更

内部岗位竞聘报告PPT模板-优页文档

momo

模板 T模板 优页文档

Vue进阶(幺贰零):父组件获取子组件验证结果

No Silver Bullet

Vue 9月日更

这本阿里JDK源码,已在阿里内部疯拿3个金奖,过这村没这店!

Java 程序员 架构 面试 计算机

为什么要坚持日更?

石云升

9月日更

Prometheus 2.21.0 新特性

耳东@Erdong

release Prometheus 9月日更

19. 今天的人工智能还不能做什么?

数据与智能

人工智能

谷歌搜索引入多任务统一模型MUM,可更准确理解信息 | Google I/O 2021-InfoQ