高品质的音视频能力是怎样的? | Qcon 全球软件开发大会·上海站邀请函 了解详情
写点什么

Cortana 即将停止服务,它为 NLP 留下了什么?

  • 2020-01-10
  • 本文字数:4800 字

    阅读完需:约 16 分钟

Cortana即将停止服务,它为NLP留下了什么?

上个月,有传闻称微软公司将叫停 Android 与 iOS 平台上的 Cortana 应用,同时计划移除 Android 版 Launcher 应用中的 Cortana 功能。2020 年 1 月 31 日,微软方面将全面停止对澳大利亚、加拿大、中国、德国、印度、墨西哥、西班牙以及英国境内用户的 Cortana 应用支持。下面来看微软当时发布的声明原文:


Cortana 是我们广泛发展愿景中不可或缺的重要组成部分,旨在将对话计算功能与生产力提升成果引入我们的所有平台与设备。为了进一步提升 Cortana 的实际作用,我们将把 Cortana 更深入地集成至 Microsoft 365 生产力应用程序当中,同时不再对 Android 及 iOS 平台上的 Cortana 移动应用提供支持。


微软公司将 Cortana 的市场定位重新划归企业级领域(特别是 Windows 与 Office)还算在情理之中,但直接关停 Cortana 移动应用则可以说在意料之外了。自去年 Javier Soltero 离开 Cortana 团队,并由 Andrew Shuman 接手管理岗位以来,到底发生了什么?带着这个问题,有媒体与 Andrew Shuman 进行了面对面交流,希望了解 Cortana 为何要退出 Android 与 iOS 平台、未来面向 Windows 的 Cortana 将走向何处、他个人对于自然语言与输入的看法,以及作为竞品的 Alexa 又有着怎样的集成之路等等。


在美国国内,Cortana 在 Android 与 iOS 上“过得怎么样”?

Shuman 首先证实,除了美国以外,Cortana 移动应用(包括微软 Android Launcher 启动程序中的 Cortana 集成功能)确实会陆续退出各国市场。此前,微软仅公布了八个即将关停 Android 与 iOS 版 Cortana 应用的国家。但包括日本在内的其他国家,最终也将挥别 Cortana 这位可爱的小助手。既然如此,Cortana 为什么不干脆也退出美国市场?



Andrew Shuman


Shuman 就此给出了一些理由。他提到,用户在配置并更新 Surface Headphones 固件的过程中,仍然需要用到 Cortana 应用程序——而目前,Surface Headphones 还仅在美国本土销售。Shuamn 指出,“仍有一部分用户在使用 Cortana 应用程序管理耳机配置。因此,如果大家拥有 Surface Headphones,我们仍将继续提供支持,保证大家能够将 Cortana 应用程序与这些耳机配合使用。”


当然,这个理由还不够充分。毕竟微软去年年初已经开始在澳大利亚、奥地利、加拿大、法国、德国、爱尔兰、新西兰以及瑞士销售 Surface Headphones 产品。如果说 1 月 30 日之后美国 Surface Headphones 用户还能使用 Android 与 iOS 版本的 Cortana,那么世界上的所有其他 Surface Headphones 用户将只能连接 Windows Cortana,这显然有失公平。


但 Surface Headphones 的买家也不用太过担心,这里放点好消息:微软公司计划在今年春季推出人们睽违已久的 Surface Earbuds。这款入耳式耳机将随附 Surface Audio 应用程序,提供 Android、iOS、Windows 版本,可同时支持现有 Surface Headphones 以及新的 Surface Earbuds——如此一来,Cortana 的设置与配置工作也算交接完成了。


接下来,Shuman 还令人意外地提到了 Cortana“驻扎”的智能扬声器——毕竟微软高管一直在刻意避免讨论这类设备。Shuman 表示,“此外,目前已经购买了微软 Invokes 智能扬声器的用户,仍可以使用 Cortana 应用程序进行产品配置——这部分市场仍然存在,所以服务支持不会中断。”


行吧,这倒也算个理由。但与哈曼卡顿合作推出的这款 Invoke 扬声器虽然仅在美国市场销售,但由于卖得太差,迫使微软在产品上市后一个月就将售价打了个五折。


Shuman 还给出了另外两个理由,希望解释 Cortana 将在除美国以外的所有国家全面退市的原因。第一,是 Android 与 iOS 版本的 Cortana 应用程序在美国以外的市场吸引力有限。他指出,“在这些计划退出的市场上,Cortana 的使用率与用户参与度都很低。”


最后,Cortana 的 Android 与 iOS 版在美国仍然比较流行,而微软也希望继续进行相关试验。Shuman 总结道,“我们认为,这种独立助手有望发挥一定作用,并充当我们尝试更多新想法的基础。我们已经在这方面进行过不少探索,但语音助手仍然还有大量机遇,只是可能短时间内得不到实际的成果。因此,我们认为继续进行快速尝试仍然非常重要。”


Windows、Office 以及其他平台上的 Cortana

最新的 Cortana for Windows 版本预计将在下一波 Windows 10 大版本升级时公布,具体时间可能是在今年 4 月或者 5 月。如果说 Cortana 的 Android 与 iOS 版本在美国以外的市场上表现不佳,那么 Windows 版本能不能扭转颓势?


Shuman 表示,“Windows 版 Cortana 在之前提到的八大市场上确实表现不错,因此我们才决定将移动应用程序迁移至 Windows 平台。考虑到我们对生产力用户的高度关注,我们认为 Cortana 应该能够在 Office 与 Windows 当中为用户带来更具意义的支持。”


换句话说,竞争对手的语音助手已经在智能手机争夺中获胜,因此微软只能将业务重点转移到企业级应用场景。


那么,Cortana 接下来还有可能出现在哪些平台上?Shuman 表示,今年之内 Cortana 有望登陆 Microsoft Teams,但目前还没有正式放出消息。


他补充道,“很明显,我们在企业领域实力更强,但同样面对着类似的难题。语音助手的本质,在于帮助人们节省时间。回顾最初 Cortana 项目刚刚启动以及探索语音助手功能的过程,我们给出的成果还是很棒的。只是,不少 Microsoft 365 用户已经习惯了以往的使用体验,因此可能会对 Cortana 的加入产生抗拒心理。他们更希望能够在日常使用的应用当中获取语音助手功能,例如 Outlook 与 Teams 之类。这也是我们目前的核心目标——一年以来,我们一直在不断尝试。”


看来除了 Windows 与 Office,未来 Cortana 有可能登陆微软旗下的几乎一切应用。


Shuman 解释道,“我喜欢把 Cortana 比作微软搜索或者微软账户,这些功能广泛存在于我们的所有应用程序当中。我们也在以相似的思路来设计 Cortana,把它当成一种以人为本的横向平面。它对用户的情况了如指掌,并将这种了解渗透至所有应用与套件的使用体验当中。从某种程度上讲,Cortana 的终极目标就是塑造用户的日常使用体验,确保大家不必在不同的体验之间往来切换。”


自然语言与输入

目前我们已经能够与 Cortana 交谈,但还无法利用它完成输入。很明显,不少用户并不想跟自己的计算机或者手机对话,因此某些助手提供语音输入功能。Shuman 证实称,Cortana 的相关功能也在开发当中。


Shuman 提到,“很高兴你能提到这个问题,我觉得人们在使用语音功能与助手应用时并不会有区别对待的心态,因此我认为应该将功能范围扩大到自然语言与助手层面。我认为这类功能确实能够在某些场景下发挥重要的作用。例如,在 Play My Emails 功能当中,我们投入大量精力以构建自然语言理解能力,确保程序能够更智能地为用户朗读电子邮件内容。可以想象,这种设计相较于以往打开 Outlook 窗格并逐字读出其中所有内容的方式,确实在便利性与使用体验方面实现了巨大改善。”


他进一步补充道,“在浏览内容时,人脑绝对不会把标签或者其他没用的东西纳入考量。只看主题、再看发送者,基本就能明白个八九不离十了。因此,我们必须在自然语言处理方面投入不懈努力,确保程序能够智能朗读内容并做出简要总结。”


与屏幕阅读器这类简单粗暴朗读所有屏显文本内容的方案不同,Outlook 的语音模式与 Play My Emails 功能能够为用户提供内容摘要服务。其甚至能够说出“John 刚刚回复了您,同时您出席本周进行的预算讨论会”这类内容。在 Outlook 当中,Cortana 还将跳过不同回复邮件之间无用的标题、底部签名文件、链接以及附件等等,确保更快更简练地传达邮件内容。


Shuman 还确认称,今年之内 Cortana 的输入功能就会全面上线。


“我们在 Windows 上一直致力于实现一项功能,即帮助打字本身就很快的用户更上一层楼。很明显,打字很快的朋友往往不愿意使用什么语音输入。但是,自然语言仍然有着不可替代的力量。举个例子,我自己现在就在经常使用日历管理个人时间,直接说出「下周五约牙医」肯定要比打开 Outlook、创建新文件、切换标签、输入「牙医」、输入「星期五」再点选空闲时间容易得多。通过这个例子,可以看到通过自然语言理解,整个数字日历管理过程确实得到了显著简化。”


Alexa 与隐私问题

自从 2018 年 8 月 Echo 扬声器发布以及 Windows 10 PC 搭载 Cortana 以来,我们就很少听说跟 Alexa 和 Cortana 有关的消息了。但这一次,Shuman 谈到了微软方面的几项未来计划。



“我们仍然希望两家公司能够进一步合作,做出新的尝试。这是一项自上而下的计划。不知道大家还记不记得,当初纳德拉和贝索斯确实达成了合作共识——时至今日,用户仍然可以通过 Alexa 激活 Cortana,反之亦然。我认为这是一项值得借鉴的宝贵经验与成就。就像在现实世界当中,优秀医生、律师或者培训师可能需要多位助手,这些助手各有所长。虽然微软还不打算进军电子商务领域,但我们的语音助手倒是很乐意帮大家在 Amazon.com 上购买商品。”(顺带一提,Alexa 在帮助用户购物方面表现得很差……)


有人认为 Alexa 与 Cortana 的跨界互动可能带来巨大的风险,但 Shuman 倒是觉得一切 OK。他指出,“当然,我们仍然在进行投入。”在被问到是否真有用户使用这类功能时,他表示“有的,这方面功能具有一定的使用量。虽然体验本身还是新鲜事物,但效果还不错。”


目前的主要问题在于,两种语音助手的设置都很麻烦。用户需要使用亚马逊账户设置 Alexa,使用微软账户设置 Cortana,再将二者关联起来。Shuman 指出,“我们当然也希望能降低这种账户关联门槛,但我也希望让用户们能够分得清自己到底是在使用亚马逊服务还是微软服务,特别是自己的隐私数据到底流向了哪里。”


用户的数据去哪了?

目前,如果用户不进行登录,那么公司一方将无法获取语音助手收集到的数据。另外,用户也没有理由在启动其他语音助手的同时拒绝登录。毕竟如果是与个人数据无关的问题,那不管问哪个语音助手,得到的结果都差不多。


Shuman 表示,“在从纯粹的消费级市场转向企业与办公室等生产力场景时”,微软方面已经逐渐意识到用户数据的重要价值。(去年 8 月,微软更新了其隐私政策,规定员工或承包商可以收听来自 Cortana 以及 Skype Translator 等服务的用户录音。


在 Shuman 看来,“这既给我们带来挑战,同时也创造出巨大的机遇。我们构建起无需人为干预的 AI 模型,因此用户的电子邮件内容不会被 Cortana 团队或者微软任何部门的员工所看到。为了实现这一目标,我们对公共数据集以及由员工提供的数据进行了复杂的采样,并对内容做出概括。对我们来说,构建起这些完全无需人为干预的 AI 模型,确实代表着一项艰巨的工作与巨大的技术性突破。”


他还补充道,“如果大家使用的是 Office 365 服务,我们会遵循非常严格的数据存储模式,确保除用户本人之外没有任何其他人能够看到数据内容。毕竟我们希望实现跨平台服务体验的一致性,因此这项承诺非常重要、必须做到。”


好助手,应该了解用户

微软目前仍在努力让 Cortana 成长为称职的生产力助手。对于生产力这一重心的关注,促使微软关闭了 Cortana 在美国以外的移动应用,并立足美国本土进行语音功能实验。此外,生产力这一核心诉求也让 Shuman 和他的团队努力在自然语言、输入以及了解用户等方面投入巨大努力。


Shuman 指出,“对我们来说,要打造一款真正出色的数字化助手,首先需要确保它认识用户、了解用户。目前,Office 用户就是我们最关注的群体,也是我们最希望为其提供帮助的群体。我们了解他们正在处理的项目,我们也了解他们与哪些同事/朋友沟通最为密切。”


Shuman 举例称,假设用户要求 Cortana“打给 Jon”。对于像微软这样的公司,名叫 Jon 的员工成百上千,但“任何熟悉这位用户的人/AI 助手,都很清楚其想要呼叫的 Jon 只有一位——Jon Hamaker,他的工作伙伴。因此根据经验,语音助手会把「打给 Jon」转换成「打给 Jon Hamaker」。”


“对于语音助手来说,这一点非常重要。好助手,应该真正了解用户。也正因为如此,我们才始终关注用户的行为,也只有这样才能为用户带来最大价值。”


2020-01-10 16:201742
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 237.1 次阅读, 收获喜欢 1266 次。

关注

评论

发布
暂无评论
发现更多内容

创业失败启示录|样茶里的商机

阿萌

28天写作 创业失败启示录 青城 2月春节不断更

python爬虫入门-通过茅台脚本讲些爬虫知识,应用和价值

大佬sam

Python python 爬虫 2月春节不断更

产品训练营第二章作业(二)

Arnold

极客大学·产品经理训练营·第二章作业(二)

二大爷

极客大学 产品训练营

图解计算机结构与体系分类!!

冰河

编程 程序员 高并发 计算机结构 操作系统原理

【并发编程的艺术】详解单例模式的实现方式(Java)

程序员架构进阶

设计模式 Java内存模型 七日更 28天写作 2月春节不断更

持续交付

lidaobing

持续交付 28天写作

第五周作业

oooh-la

大背景 (28天写作 Day25/28)

mtfelix

28天写作 新能源汽车 新能源革命 碳中和

就算知道了答案,真的会改变吗?「幻想短篇 25/28」

道伟

28天写作

第十周 模块分解作业

简简单单

一文看完TCP/IP协议基础知识点

产品经理训练营作业 02

KingSwim

话题讨论|过年回家你带电脑吗?

熊斌

话题讨论 28天写作

28天瞎写的第二百三十五天:客服得有多专业?

树上

28天写作

被接连封杀后,出海的“TikTok们”都打算如何做?

李忠良

28天写作

传统线程同步通信技术

武哥聊编程

Java 多线程 28天写作

架构师训练营第十周作业

zamkai

Python 中 sorted 如何自定义比较逻辑

zikcheng

Python sorted cmp

时间约束帮助我写作

Justin

方法论 创意 习惯养成 28天写作

Spring - IOC

小马哥

Java 架构师 spring 5 七日更

机器学习·笔记之:Matrices and Vectors

Nydia

第三章:产品解决方案作业

让时间说真话

产品经理

持续进步的不二法宝-PDCA

Ian哥

28天写作

第十周 学习总结

简简单单

为啥写的mybatis插件没用?一场mybatis插件加载机制的探索之旅

altantisor

spring Boot Starter mybatis源码

开发质量提升系列:标准模板(中)

罗小龙

最佳实践 方法论 28天写作

不要在nodejs中阻塞event loop

程序那些事

node.js Event 事件循环 程序那些事 nodejs event

【WOW.js】Animate.css的黄金搭档

德育处主任

CSS 动画 js 28天写作 2月春节不断更

批判性思维自修课(六)

石君

28天写作 批判性思维

产品训练营-作业3

简小一

Cortana即将停止服务,它为NLP留下了什么?_AI_Emil Protalinski_InfoQ精选文章