2016 年:DeepMind 给人类带来了什么?

  • 刘志勇

2016 年 12 月 25 日

话题:语言 & 开发架构

自从 DeepMind 以 4:1 战胜围棋世界顶尖选手李世石之后,就声名鹊起,经常登上各大媒体的头条。从那以后,人工智能开始成为人们经常谈起的话题。

DeepMind 是一家位于英国的尖端科技公司,曾让 Facebook、Google 等巨头争相抢夺,最后 Google 在 2014 年 1 月以 4 亿英镑(6.66 亿美元)击败 Facebook 成功收购了 DeepMind。Google 已经在机器学习和 AI 领域处于前沿地位,那为什么还要不惜代价斥巨资来收购 DeepMind 呢?究竟 DeepMind 能为 Google 带来怎样的价值呢?

2015 年 10 月之前,Google 庞大的广告收入开始投入到 DeepMind 及众多类似的项目中去,然而这些项目谷歌花费时间及精力,却没有任何收入。后来,Google 如召唤神龙一般成立了母公司 Alphabet,自身反而成为这家 Alphabet 公司旗下唯一盈利的子公司。其他业务的经营收入从 Google 的资产负载表上拆分,Alphabet 其他业务的经营状况将会受到更加严格的审查,再也无法依赖 Google 这棵大树的庇荫了。

此次变动之后,DeepMind 在新架构中仍隶属于 Google。但它的价值远超过自身利润。

对 Google 和 Alphabet 而言,DeepMind 为公司在人工智能军备竞赛中占据了先机,有助于吸纳 AI 人才。来自牛津大学、伦敦大学、剑桥大学、斯坦福大学等人才纷纷选择了 Google,而非 Facebook、Microsoft 和 Amazon。其办公室目前已有 400 多名计算机和神经系统科学家,其中约四分之三在研究部门工作,其余的在应用部门,后者致力于构建基于人工智能的显示产品和服务。据悉他们计划未来扩大到 1000 人,除了在海外设立研发机构外,还招聘了一系列的人工智能专家,计划组建“人工智能安全团队”,旨在降低人工智能可能带给人类灾难的风险。

2010 年,Demise Hassabis 同 Mustafa Suleyman、Shane Legg 共同创立了 DeepMind 公司。DeepMind 的格局并不限于招募人才和曝光次数。其 CEO 与联合创始人 Demis Hassabis 将 DeepMind 描述为一种新形式的研究机构,结合了学术界的长远视角和“科技初创企业的专注和活力”。

Hassabis 表示,DeepMind 的目标是攻克“人工智能”的课题。这就促使公司需要研发多功能的“通用”人工智能,能够像人类一样进行广泛和高效思考。被 Google 收购之后,DeepMind 受益于 Google 强大的计算资源和雄厚的财力,如果让小公司收购的话,很可能会被要求尽快盈利,这样 Hassabis 会被种种繁琐事物打扰,而无法专注于研究。DeepMind 办公地点同过去一样仍旧设在伦敦,与硅谷山景城 Google 所在地保持安全距离,这样得以让 DeepMind 拥有更多的独立性。

如果 Hassabis 将来有一天真的研制出通用人工智能,对 Alphabet 而言将是一个巨大的成就。因为,这意味着创造了可无限被复制的数字化员工,并用于解决各种问题。不过,据了解,DeepMind 并非一家以商业模式运作的公司,其研发周期非常长,Hassabis 表示公司规划了长达 20 年的蓝图规划。他声称,从人类大脑获取灵感的思路,让 DeepMind 远超其他专注于机器学习,尤其是“深度学习”的研究机构。

即使 DeepMind 无法成功研制出等同或超越人类水平的人工智能,它开发的机器学习软件仍然可以为 Alphabet 做出很大的贡献。

今年 7 月份,Google 宣布,DeepMind 研发的学习软件已经成功让 Google 数据中心的能耗减少了约五分之二。该软件是通过学习数据中心的操作日志进行压缩,并不断地进行模拟操作,最终实现了过程的优化。

DeepMind 也在尝试利用现有的 AI 成果为公司创收。Suleyman 表示,DeepMind 的某些研发进展可用于管理能源基础设施、改善医疗系统、提供清洁水源等领域,这些都是他们盈利的潜在目标。

今年 11 月,DeepMind 与 NHS 旗下的基金会 Royal Free London 签订了为期五年的合同,任务是处理 172 万患者的医疗记录。今年早些时候,它获得了来自其他伦敦医院的两个数据库:一个是一百万张视网膜扫描报告,用于让 AI 软件确定退行性眼病的早期征兆;一个是通过头颈部癌症图像用于训练 AI 软件来识别健康组织和癌变组织。

其中,诊断退行性眼病的早期征兆的方案,是 Moorfields 眼科医师 Pearse Keane 最先想到这个方案,他看到 Google 如何利用 DeepMind 来学习游戏,便与 Google 联系,他相信 DeepMind 应该也可以用于眼科诊断。

尽管 Google 保证只会处于诊断和治疗目的来使用这些数据,但是这个项目还是引发了很大的争议。DeepMind 联合创始人 Suleyman 表示,公司有恰当的协议,以确保数据由医院控制。此外,公司的目标是操作尽可能透明,而且也会与第三方审计师合作。DeepMind 也在开发“通用透明架构”,将记录数据何时被访问,由谁访问等日志信息。

DeepMind 还尝试将 AI 拓展到音频领域。语音机器人很早以前,就出现在科幻小说里了。随着苹果 Siri 等产品商业化,表明了这项技术已经进入主流。但机器和人类之间的语言差异还是很大。DeepMind 开发了一套文本 - 语音转化系统,名为 WaveNet。它可以将这种差异缩小逾 50%,使用了神经网络复制人类的声波,不再像以前那样单纯复制他们使用的语言。

熟练的程序员和强大的计算设备是这类 AI 应用的关键。但是,获取足够数量的现实世界环境的数据也很重要。当医院,电网和工厂等系统的目标是利用 AI 和机器学习的技术时,需要提供具体的操作数据。

Alphabet 当然拥有海量可服务于这些目的的数据。但是,有关特定的探索领域,DeepMind 必须获取足够的数据用于训练,现有的数据远不能满足需求。它最近参加了一个研究读取唇语的项目——LipNet,取得了成功,源于团队掌握了前所未有的庞大的数据集。这项研究由计算机视觉研究者 Andrew Zisserman 为首的牛津大学的一个研究小组带领。BBC 为其提供了数十万小时的新闻录像,如果没有这些数据,根本不可能训练出 LipNet。

Hassabis 认为,未来数据获取对 DeepMind 的重要性会越来越小,他表示,工程师可以构造出用于解决问题的模型,然后在这些模型部署 DeepMind 让它进行自我学习。这种运作方式,目前大多数机器学习系统并没有掌握。

那个震惊全球、打败围棋世界冠军李世石的阿尔法狗,是先从 16 万场人类对弈的数百万个棋局中进行学习,然后才进行迭代式自我对弈,通过不断的训练,提升棋艺。这样,如果要获取大量的个人信息,它就应该考虑清楚如何应对客户们对企业数据安全的担忧。

如果 DeepMind 能顺利解决这类问题,那么它就会成为 Alphabet 的一家算法工厂,它带来的意义和价值,将远不仅仅是 AI 研究机构和人才集聚地。DeepMind 需要的数据,仍然归原本拥有者所有,这就可以解决有关隐私权的问题,但是,由其开发出来的算法,将属于 Alphabet。也许,DeepMind 无法依靠这种方式来创收,但它可以通过分析数据获取的知识或者技能,在未来的商业竞争中,将为 Alphabet 带来巨大的优势,让 Google 为竞标所付出的努力,物有所值。

近日,Elon Musk 支持的机构 OpenAI 开源了通用性人工智能 Universe,据 OpenAI 公司称,他们的目标是,开发一种单一的人工智能代理,可以灵活地将以往的经验运用在 Universe 环境上,循序驾驭不熟悉、困难的环境,这将是实现通用智能的一大步骤。

DeepMind 与 Universe 的工作方式不同。DeepMind 工作方式类似 3D 游戏平台,以第一视角来观察 3D 世界;而 Universe 则是通过代理观察屏幕像素,并生成键盘和鼠标命令来操作远程桌面。

Suleyman 说,DeepMind 的目标是“破解智能,让世界更美好”。创立 DeepMind 的初衷就是希望能够构建出达到人类智能水平的智能系统,但是,实现这个目标需要几十年。他说,“这里提到的二十年或者几十年,事实上远不止这么久。谁也无法准确预测具体时间。”在此之前,DeepMind 将专注于解决具体的问题。

对人类来说,通用性人工智能会不会是一件好事呢?让我们拭目以待。人类可以主宰自然世界的原因,并不是因为我们比其他动物更快、更强壮、更聪明,而是因为我们更智能。也许,这些会学习的人工智能是人类地平线上的乌云。也许,它们就是人类最后的发明。


感谢朱昊冰对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们。

语言 & 开发架构