Gmail Inbox发布基于深度学习的智能回复功能_语言 & 开发_张天雷

东亚银行、岚图汽车带你解锁 AIGC 时代的数字化人才培养各赛道新模式！了解详情 



 写点什么

作为日常工作最主要的沟通手段，Email 在发明后几十年仍然活跃在工作第一线，越来越多的智能功能被添加进来。近日，继旅程助手和提醒推荐功能以后，Gmail 团队发布了Inbox 最新功能：智能回复（Smart Reply）（界面如下图），并撰文阐述了背后基于深度学习的实现思路。

推出智能回复功能的契机很直白：由于工作强度的增强，人们的交流日益频繁，然而大多数人有用手机收发邮件的习惯，使得回复Email 有时变成了很烦躁的事情，费时费力。而很多时候，工作邮件都可以通过一些简短的回复例如“正在尝试”、“马上发给您”、“开会时讨论一下”等等来解决。智能回复就是基于这种考虑，通过深度学习技术，来“猜测”可能的简短回复，帮用户简化回复过程。智能回复会基于用户收到的邮件内容，来推荐三个可能的回复供用户选择，一个直观的展示参见下图：

智能回复将此前数次按键输入直接简化为一两次，极大方便了用户，提高了Inbox 体验，而后台支撑该功能的技术却是相当复杂。Inbox 利用机器学习技术（确切来讲是深度学习技术）识别那些能够被“秒回”的邮件，并动态生成回复。值得一提的是，用户选择智能回复词的过程中，后台的机器学习模型会根据选择不断迭代。下面再介绍一些具体的技术细节。

在展开介绍之前，多说一句Google 内部的很多项目都在使用机器学习技术来改进用户体验，比如利用深度学习改进语音搜索和 YouTube 缩略图等等。因此 Gmail 团队的 Bálint Miklós 看到了上文中提到的回复邮件痛点，找到资深科学家 Greg Corrado，后者表示了极大的兴趣。

智能回复的原理是很复杂的，涉及到自然语言理解和生成技术，这些技术多用于机器翻译，而回复邮件也可以抽象认为是个机器翻译问题，即来信是一种语言，而回信是另一种语言，智能回复就是要理解来信，并“翻译”生成回信。长期的实践已经表明相关技术并没有发展到能直接应用到产品中的程度，大部分时间都只能实现一些逗乐聊天机器人。但对于智能回复词这一特定场景，是能够给出比较满意答案的。Google 科学家 Oriol Vinyals, Ilya Sutskever 和 Quoc Le 在去年曾重点研究理解和生成技术，称为序列学习，Greg 的同事Anjuli Kannan 在此基础上开发了可生成智能回复的产品级神经网络。

类似其他序列学习系统，智能回复功能由一对RNN 组成，如下图所示。

一个用来对用户收到的邮件内容进行编码，另一个则用来预测可能的回复。编码网络一次读入一个单词，然后生成一个由数字组成的向量。该向量被Geoff Hinton 老先生称为“ thought vector ”，能够在一定程度上表达邮件的语义。在这种情况下，英文句子“Are you free tomorrow?”和句子“Does tomorrow work for you?”语义距离更近。第二个网络根据 thought vector 来生成一个语义语法都正确的回复。值得一提的是，整个网络都无需任何人工接入，完全通过历史邮件和回复来学习模型。

Greg 提到，跟邮件打交道的一个挑战就是，学习模型的输入和输出都很长，有时多达几百单词。因此需要选择合适的 RNN 模型，Google 选择的是 LSTM 模型，能够很好处理比较远的单词之间的依赖关系，并能够发现邮件内容中最重要的部分，而不会被附近的短句所影响。Greg 还提到，另一个挑战就是用户的隐私问题，在模型训练的过程当中，要保证没有任何人阅读用户的邮件，全程都是机器自动化操作。

最后 Greg 还分享了开发过程中的一些感受。最开始的时候，智能回复给出的三个答案基本意思相同，用户很难取舍。最后机器学习专家 Sujith Ravi 解决了这个问题，并表示这是一个典型的“回复多样性”缺乏问题，可通过计算句子语义相似度来解决，而不仅仅是考虑单词的相似度。另一个早期版本中的问题是不管邮件内容是什么，智能回复都倾向给出“I love you”的回复，因为类似感谢、听起来不错和我爱你这样的回复太常见了。后来通过对可能回复的概率进行归一化解决，使得回复不但常见，而且要和邮件的内容也比较相关。

据悉，智能回复功能将会在下周发布的 iOS 和 Android 版本中，感兴趣的读者可以进行更新尝试。

感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作，请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博（ @InfoQ ， @丁晓昀），微信（微信号： InfoQChina ）关注我们，并与我们的编辑和其他读者朋友交流（欢迎加入 InfoQ 读者交流群）。

公众号推荐：

2024 年 1 月，InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》，揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步，预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」，回复「大模型报告」免费获取电子版研究报告。

发布

暂无评论

创作场景

Gmail Inbox 发布基于深度学习的智能回复功能

公众号推荐：

评论

Linux之at命令

新版上线｜能力中心打造全新视角

分享你的见解与经验｜RocketMQ Summit 2022 议题征集中！

dubbogo 入围 2021 年“科创中国”榜单

架构实战营4期-模块七作业

Rootkit Hunter恶意程序查杀

架构实战营 4 期第七模块作业

虎符交易所完成首次HOO回购超40万HOO添加到虎符AMM流动池

吃到多样性红利的12种方法

我与音视频的故事 | 社区征文

Web Components 系列（十）—— 实现 MyCard 的基本布局

王者荣耀商城异地多活架构设计

架构实战模块7

网络安全kali渗透学习 web渗透入门使用WireShark对常用协议抓包

利用 Helm 在各类 Kubernetes 中安装 Rainbond

作业：架构实战营模块 7

OCR技术用于在线身份认证的运营效果分析

大模型应用新范式：统一特征表示优化（UFO）

“热搜”中的分布式数据库

告警运维中心｜构建高效精准的告警协同处理体系

《Sysdig 2022云原生安全和使用报告》发现：超过75%的运行容器存在严重漏洞

当元宇宙遇上梵高

golang context详解

架构实战营模块七作业

第八周作业

王者荣耀商城异地多活架构设计

云效应用交付平台 AppStack,10分钟完成代码提交到上线

在线YAML转Properties工具

使用Rainbond部署Logikm，轻松管理Kafka集群

模块七

netty系列之:channelPipeline详解

创作场景

Gmail Inbox 发布基于深度学习的智能回复功能

公众号推荐：

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载