Michael I.Jordan:深度学习不是 AI 的全部,人工智能革命尚未到来

阅读数:1385 2019 年 9 月 6 日 13:40

Michael I.Jordan:深度学习不是AI的全部,人工智能革命尚未到来

「经常有人问我,AI 的未来是什么?你对未来有着怎样的展望?我通常会说,那些金融科技公司所处的生态领域内的发展,将是未来 AI 最有意思的地方。」

在 2018 年 4 月 25 日蚂蚁金服 ATEC 首届金融科技开发者大赛发布会现场的演讲中,迈克尔·欧文·乔丹(Michael I.Jordan)乔丹教授说道。也因为如此,他指出,「基于今天举行的大赛,大家可以去思考怎么样用工程师的头脑解决问题,而不是用魔术的手段带来奇迹。」

乔丹教授此番表达,与其日前发表的《人工智能:革命尚未到来》一文观点一脉相承。

日前,「机器学习之父」、加州大学伯克利分校的电子电机和计算机系以及统计系教授,美国国家科学院、美国国家工程院、美国文理科学院院士,蚂蚁金服科学智囊团主席迈克尔·欧文·乔丹(Michael I.Jordan)发表了一篇文章,指出了当前业界人工智能研究的局限性,提醒大家不仅深度学习不是「人工智能」的全部,甚至我们日常讨论的以「数据统计」为主的「人工智能」都不是真正意义上的「人工智能」。

在文章中他提出,不管在短暂的未来中我们能否真正理解「智能」是什么,我们都无法忽略能够将人工智能工程化的新学科。他说到,「我们需要意识到现在所发生的关于人工智能的公众对话,只关注到工业界和学术界的一个很小的子集。这可能会让我们变得短视,无法看到人工智能、智能强化、智能基础建设里的挑战和机会。」

这是事关重大的问题。在 2018 年 4 月 25 日蚂蚁金服 ATEC 首届金融科技开发者大赛发布会现场的演讲中,乔丹教授再一次以具体案例来阐释了当前人们容易忽略的问题。

Michael I.Jordan:深度学习不是AI的全部,人工智能革命尚未到来

举个例子——多重决策能力缺乏导致的潜在问题。一般 AI 的工作都是基于假设,比如,如果要知道从某个出发点到达机场的路线,一般做法是搜集一些数据,统计每条交通路段的堵塞情况,然后找到一个最优化的路线。但如果大家都这么做,那么当大部分人一起出发去机场上同一条路,无疑交通将一下子就变得非常拥堵,大家都到不了机场。

「这是因为,大多数的 AI 系统一次只做一个决策,他们并没有一种交叉的方式来做多重决策。这是系统的问题,是统计的问题。」乔丹教授解释道。

现实生活中,我们会利用 AI 做智能推荐,比如投资标的、产品营销。但重要的问题是,给大部分人推荐同一只股票,结果会如何?也就是说,「在决策中,系统必须考虑资源稀缺性的因素。这是负载均衡的问题。」

事实上,乔丹教授还列举出了许多类似由于 AI 应用缺乏系统关联、缺乏工程化等导致的潜在需要解决的问题。

Michael I.Jordan:深度学习不是AI的全部,人工智能革命尚未到来

所以,蚂蚁金服 CTO 程立表示,「举办 ATEC 大赛的初衷,是希望把我们最有价值的东西奉献给行业,一方面,这是来自于真正生产中非常有价值的问题,通过大赛把生产、业务中遇到的问题提炼出来,分享给大家一起解决。」这些问题,包括如何利用迁移学习、无监督学习等解决被“小数据”问题困扰的风险识别和智能服务场景。

然而,除了向学术界开放金融科技行业中关键的场景,为 AI 研究提供有效的训练场,更重要的是——乔丹教授提及的「智能基础建设」。

所谓「智能基础建设」(Intelligent Infrastructure, II)的网络,乔丹教授表示,它指的是一种由计算能力、数据和相关的物理实体组成的网络。这种基建开始出现在交通,医药,商业和金融等领域,它讲 AI 应用研究指向一个更广大的挑战:分析数据流从而发现更多的知识,它不仅对个体,发挥作用,而是有能力对整个社会发挥巨大的作用。

智慧基础设施需要的是管理快速变化的、而且很有可能全局不相干的分布式知识存储的能力。这样的系统需要云计算和边缘计算之间的互动,才能做出即时的、分布式的决策;而且还需要能够处理数据中的长尾现象,即关于某一些个体有很多的数据,但大多数个体都只有很少的数据。

有时候人们谈起的物联网(IoT),仅是把「物」连接到了「网」上而已,对于如何让这些「物」处理数据流、发现关于世界的信息、与人类互动等等超越 0 和 1 组成的数据的高级抽象问题完全没有触及。但未来,在已有的基础设施下,这些问题的挑战门槛都会逐步被降低。

正如本次 ATEC 开发者大赛所列举的两个赛题:支付风险识别和基于 NLP 突破的智能服务。前者面临的问题是,黑产瞬息万变,客服场景中面对的需求也是实时的,如何提高模型适应性,让模型能够更加快速、可以基于更少量的数据做出更精准的识别,理解用户的意图。这些被学界关注,工业界亟待解决的“小数据”问题,都在此次大赛中被提上日程。

基于蚂蚁金服的自研分布式数据库技术,面向万物互联网的云计算技术,算法应对比如隐私、安全和可靠性等问题,既是 AI 改变金融、改变社会的挑战,也是在与基础技术相互促进之下,面向未来的机遇。

用程立的话来说,「随着大数据,大计算以及很多新兴技术的加持,AI 不再只是简单模仿人类的成果,而是成为一种新的能力,成为新型的智能。像水一样渗透在经济、社会的每一个角落,帮助我们解决问题。」

以下,我们特别转载乔丹教授日前发布的文章《人工智能:革命尚未到来》,与大家一起探讨体会当前 AI 研究的问题和方向。此文原文链接: medium.com/@mijordan3/5e1d5812e1e7,译者为 Chiao-Yu Yang。

人工智能(AI)是当代的魔法:一个被学者、技术人员、风投资本家屡屡提及的事物。很多其他从学术界迁徙到公众视野的名词都引发了很大的误解,这一次人工智能也并不例外。但这一次,不仅仅是一般的公众不理解科学家而已:不在相关领域工作的科学家和公众这次一样对这个概念产生了误解。我们产生了这样的想法:硅基智能足以匹敌我们自身–这个想法引起了极度的兴奋,但也引起了同等的恐慌。与此同时,不幸的是,这个想法转移了我们的注意力。

在这里,我想先讲一个关于人类、计算机、数据以及生死的故事,但这个故事和硅基智能无关。在 14 年前,我的妻子怀孕的时候做了一次超声波检测。一个基因专家指着胎儿心脏附近的一些白点,说到:“这些是唐氏综合症的标志,胎儿患上唐氏综合征的危险已经上升到了二十分之一。”她还告知我们,我们可以通过羊膜穿刺术知道胎儿是否真的患有唐氏综合征,但是羊膜穿刺术不是绝对安全的,它有大约三百分之一的概率会导致流产。接下来的故事大概是,我发现十年前英国有关于这些白点的一些统计分析,当时科学家发现这些白点反映了钙的堆积,从而开始把这些白点用作预测唐氏综合征的指标。与此同时,我也注意到了我们做超声波的成像机器和英国的那个研究用的机器是不同的:在每平方厘米的面积上,我们用的机器大约多了几十个像素点。我回去告诉了那个基因专家这些事情,并告诉她我相信这些白点可能只是假阳性:它们仅仅只是成像中的白噪音而已。她说,“啊,怪不得在前几年新机器投入使用以后,我们开始发现越来越多的唐氏综合症患儿。”

后来,我们没有做羊膜穿刺术,一个健康的女孩子几个月后诞生了。但这件事情让我感到不安,一个简单的计算让我相信世界上每天都有数以千计的人得到相同的分析,他们中很多的人会选择去做羊膜穿刺术,而那会导致很多婴儿无辜地死去。同样的事情不断地发生,直到人们发现并解决这个问题。我讲述这个故事,并不是为了表述我对个人医疗的担心;这是一个医学系统的事情,现有的医学系统,在不同的时间和地点,测量了变量和结果,做出统计分析,然后把这些分析套用在其他的时间和地点。这里牵涉到的不仅仅是数据分析的问题,还有一个数据起源的问题(数据库专家称之为“Provenance”):数据从哪里来的,我们做了什么样的推论,这些推论在当下的场景是否适用?一个受过训练的专家,可能可以对每一个个案做具体的分析,然后得出结论,但这很难推广:我们需要设计一个覆盖整个星球的医疗系统,让它在没有分析员对每一个个案进行非常耗时的监督的时候也能自动地完成这些分析。

我是一个计算机科学家,但在我的教育中,我没有找到一些合适的原则来制造这个星球规模的推论和决策系统,来融合计算机科学和统计学,并且考虑到人类的福利。我开始认为,发展这些原则 - 不仅仅是在医学领域,也在商业,交通,和教育 - 至少是和建造那些可以拥有酷炫的游戏或者感觉技能的人工智能系统同等重要的。

不管我们能否在短暂的未来理解“智能”是什么,我们都已经面临一个巨大的挑战:如何把计算带入到人类的生活之中,并使之改善人类的生活。有些人觉得这种挑战蕴含了人工智能的创造,但我们可以用一个更加平凡但同等富有敬意的看法,这种挑战标志着一个新的工程学分支。就像过去几十年里的土木工程和化学工程一样,这个新的学科尝试融合几个核心想法的力量,将新的资源和可能性通过一种“安全”的方式带给人类。土木和化学工程的基石是物理和化学,而我们的这个新的工程的基石是上个世纪带给我们的一些概念–比如信息,算法,数据,不确定性,计算,推论,和优化。而且,因为这个学科的重点在于信息和人类,它的发展将需要来自社会科学和人文学科的参与。

虽然这些基石已经出现,但是把它们融合在一起的原则却还没有完备,因此,现在我们只能用一些暂时性的方法把这些基石放在了一起。

人类在土木工程出现之前,就已经开始建造楼房和桥梁。相似地,我们在这个新的工程出现之前,就已经开始建造社会规模的推论决策系统,并在其中包含了机器、人类、环境。当然了,就像早期的建筑和桥梁有时候会不可预知地倒塌并带来悲剧性的结果一般,我们很多早期的社会规模的推论决策系统也已经表现出了概念性的错误。

现在,公众对话里太经常地把“人工智能”当做一个万能牌来使用,这种用法让我们更难搞清楚这个新兴科技的范围和意义。现在,让我们回过头来,重新认真地从历史和现代的角度来审视“人工智能”这个概念。

很多现在被称为“人工智能”的东西(尤其是公众领域里),在过去几十年里一直被称为“机器学习”(Machine Learning, ML)。机器学习是一种算法领域,它将统计学,计算机科学,和很多其他的领域(见下文)结合在一起,来开发可以处理数据,做出预测,帮助决策的算法。从很多年前开始,机器学习就已经对真实世界产生了影响。事实上,机器学习会发展出工业上的大规模应用这件事在 90 年代就已经初现端倪了。到了世纪之交的时候,一些像亚马逊一样具有前瞻性的公司已经开始在他们的商务中应用机器学习来解决欺诈检测中的后端问题,做出物流链中的预测,以及建造革新的面向用户的服务,比如推荐系统。当数据和计算资源在接下来的二十年里突飞猛进,我们看到机器学习不止帮助了亚马逊这样的公司,还帮助了基本上所有业务中和大规模数据有关的公司。新的商业模式随之出现,“数据科学”这个短语来开始被用来描述这些事情。某种意义上,这也反映了要完备这个系统,机器学习算法专家需要和数据库专家,分布式系统的专家一起将这个系统打造得可扩展且鲁棒,而这个系统本身也在社会和环境层面上有着越来越大的影响。

但是,这些概念和技术在过去的数年里,被包装成了“人工智能”。这种包装是值得商榷的。

历史上,“人工智能”这个词是在 50 年代后期被发明的,它被用来指代设想中的通过软件和硬件来实现的具备类似人类智能的实体。我们将使用“类人智能“(human-imitative AI) 来指代这种构想,从而强调这种人工智能实体会和我们很相似(至少在心理层面上)。这主要是一个学术界的工作。一些如运筹学、统计、模式识别、信息论、控制理论之类的学科已经存在,并常常受到人类和动物的智能的启发,但这些领域主要关注“底层”的信号和决策。比如一只松鼠能够感知一个三维的森林,并在树枝之间跳来跳去的能力,对这些领域是具备启发性的。但”人工智能“关注的是不同的东西,它关注的是人类“高级”或者说“认知”层面上去“推理”和“思考”的能力。在人工智能这个概念被提出后六十年后的现在,这些能力依然还是触不可及的。这些现在被称为“人工智能”的工作,大多数出现在和底层的模式识别和动作控制相关的工程领域,也出现在统计学 - 一个关注数据中的预测、假设检验、决策的学科。

事实上,著名的“反向传播”算法,在 80 年代初期曾经被 David Rumelhart 重新发现,现在被认为是所谓的“人工智能革命”的核心,但其实它最开始出现在 50 和 60 年代的控制理论(control theory)的研究中。它的一个早期应用就是在阿波罗号宇宙飞船飞向月亮的时候,优化它的推动力。

自从 60 年代以来,我们有了很多的进展,但这些进展并不是从追求发展类人 AI 中得来的。其实就像在阿波罗号的例子中这样,很多这些方面的进展隐藏在一些工程问题的背后。工程界的研究人员在解决一些具体的问题的时候所提出的方案,实际上对后来的机器学习产生了深远的影响。虽然那个时候机器学习还没进入公众视野,但是它已经在诸如文本提取、文本分类、欺诈检测、推荐体统、个性化搜索、社交网络分析、规划、诊断、还有 A/B 测试等领域取得了巨大的成功,而这些领域的进步,催化了诸如谷歌,Netflix,Facebook,亚马逊这样的公司的诞生。

我们可以简单地把这些东西称呼为“人工智能”,而且事实上人们似乎正在这么做。优化和统计学的研究者对这种标签是有点令人惊讶的。一夜之间,他们发现自己从计算机科学家或者统计学家变成了人工智能专家。但除了研究人员的标签,更大的问题是这个简单且定义模糊的短语,阻断了我们对于学术问题和工业问题的清晰的理解。

过去的二十年,学术界和工业界在“强化智能” (Intelligence Augmentation,IA)的领域得了巨大的进步。强化智能指的是利用数据和计算来加强人类的创造性和智力活动。一个搜索引擎是“强化智能”的一个例子,因为它加强了人类的记忆力和事实知识;语言翻译引擎则加强了人类的交流能力;基于计算的产生声音和图像的软件则成为了艺术家手里全新的染色版。虽然强化智能的工具可以加入推理和思维,但是它们还做不到。现在这些工作能做的是去尝试匹配字符,去进行数值计算,从而抓取一些人类可以使用的模式。

我希望读者能够忍受我再提出一个词汇,让我们考虑这个叫“智能基建”(Intelligent Infrastructure, II)的网络。它指的是由计算、数据和物理实体共同组成的网络,旨在让人类所居住的这个社会更加有趣、高效、安全。这种基建开始出现在交通,医药,商业和金融等领域,并对个体和社会发挥了巨大的作用。人们有时会把这些事情称之为一种网络,比如物流网络,但这种说法有时候指的是把这些东西输入到互联网而已,而非指代一个更广大的挑战:分析数据流从而发现更多的知识,和人类以及其他事物在一个比单纯的比特更加抽象的层面上互动。

让我们回到我文章开始时所提到的社会规模的医疗系统。这样的一个系统,在医生和患者佩戴的仪器之间建立起数据流和数据分析流,从而帮助人类的智能去做出更好的诊断和医疗。这个系统会结合体内细胞、DNA、血液检测、环境、人群基因,和庞大科学文库里对于药物和治疗的信息。它关注的不仅仅是一个患者和一个医生的关系,而是人类之间相互的关系:就像现在的药物试验里一样,它让一群人或者动物的实验对其他的人类产生更大的福利。它保持了数据的相关性、起源、可靠性,正如现在的银行系统在金融和支付领域做的一般。我们可以预见到这个过程中会产生很多的问题,比如隐私,安全,和可靠性,但这些问题应当被视作挑战,而非阻挡我们前进的理由。

现在,我们来到了这个问题面前:发展类人智能,是否是最好或是仅有的去克服这些挑战的方法?机器学习领域最近有很多优秀的成果是和类人智能有密切联系的,比如计算机视觉,语音识别,游戏,和机器人。所以我们也许应该期待这些领域有更多的好进展。但是,我们需要澄清两点事情。第一,虽然我们未必能从新闻上读到,但事实上类人智能的成功是非常有限的,我们离成功实现类人智能还有一段非常漫长的道路。但不幸的是,即使是非常有限的进步,也带来了很多的兴奋(和恐惧),而这在其他工程领域是不存在的。

第二点,也是更重要的一点,类人智能的成功,对于解决强化智能和智能基建的挑战,既不是必要的,也不是充分的。我们先讨论必要性。考虑一下自动驾驶的汽车。要实现这样的科技,我们需要解决一系列的工程问题,而这些问题可能和人类作为司机的能力或者不足是没有太大关系的。我们所设想的智能地面交通系统(也是一个智能基建系统)或许不该一味仿照现在地面上横冲直撞,只能看得到前面,有时缺乏注意力的人类司机。理想的地面交通系统可能和现在的空中交通系统是更加类似的。它会比现有的空中交通交通系统复杂得多,特别是在应用海量的信息,并且应用一个自适应的统计模型来得出好的决策这方面上:这些才是我们需要面对的问题,在这个时候去研究一个像人一样驾驶的司机,可能只是走了弯路。

我们现在讨论充分性。有时候人们会说类人智能的雄图已经包括了智能强化和智能基建,因为一个类人智能的系统不仅能解决一些经典的人工智能问题(比如图灵测试),也会成为我们通往智能强化和智能基建道路上最强力的助手。但是,这种想法没有太多的历史先例。土木工程的发展是通过创造一个人工智能的木匠或者砖匠吗?化学工程曾经靠预想一个人工的化学家来实现吗?更加有争议性的一点是:如果我们的目标是建造化工厂,难道我们应该先制造出一个人工化学家,再让它去解决建造化工厂的问题吗?

另一个论点是,人类智慧是我们已知的唯一一种智能,因此我们应该尝试在最开始尽量去模仿它。但事实上人类并不是很擅长一些推理:我们会精神涣散、有偏见、有限制。更重要的是,我们并没有进化出能够解决智能基建问题所需要的大规模决策问题的能力,也不擅长应对智能基建里出现的各种各样的不确定性。可能有人会争论说,一个人工智能系统不仅可以模仿人类智能,还可以“修正”它,并且能够延展到任意大的问题。但这种说法会让我们陷入科幻小说的领域:这种构想式的论点,虽然在小说里会很有趣,但不应该成为我们在面对智能强化和基建的时候的主要指导方针。我们应该尝试直接去攻克这些领域的难题,而不是希望这些问题的解答会成为一个类人智能系统的副产品。

要找出类人智能研究中所遗漏的和智能基建相关的算法或基建问题并不难。智能基建系统的建成需要一种能力:一种能够管理分布式知识库的能力,并且这个数据库是快速演变的,更糟糕的是,它在全球范围内未必一致。这种系统必须在应对云端互动的时候,能够做出及时的分布式决策,并且能够处理长尾现象(有的个体有大量信息,但绝大多数个体只有少量的信息)。它们必须能够解决在分项数据时所遇到的管理问题和竞争问题。最后,也是尤其重要的一点,智能基建系统必须把经济学里的一些如动机和定价之类的概念带入到统计和计算的框架里,从而把人类和人类,人类和各种各样的商品或服务连接起来。这种系统不应当只被视作提供了服务,事实上,它们创造了市场。诸如音乐、文学、新闻这些领域,都在迫切地期待这种把创作者和消费者通过数据分析紧密连接在一起的市场。而且,所有的这一切,都必须适应不断演变的社会,道德,和法律体系。

当然了,经典的类人智能问题一样有着巨大的价值。但是,现在人工智能领域的中心是收集数据,使用“深度学习”框架,和展现一些具有很大限制性的人类技能,而不是在寻找一些解释性原则。这种做法会让我们忽视人工智能里主要的开放问题:包括引入意义和推理到自然语言处理系统,推论和表达因果性,发展一些对不确定性的可计算的表达,发展一些可以规划和追求长期目标的系统。这些是类人智能研究的经典目标,但在当下所谓的”人工智能革命”的热潮里,我们很容易遗忘这些问题从没有被解决。

另一方面,除了智能基建之外,智能强化一样是核心的,这是因为在可预见的未来里,计算机还不能达到人类一般的对现实世界的抽象思维能力。我们需要一些优良的人机互动来解决很多现在的问题。我们也希望计算机能够引发人类的创造性,而不是取代人类的创造性。

很久以前,John McCarthy(时任达特茅斯学院的教授,但不久后他去了麻省理工学院)发明了“人工智能”这个词汇。显然,他用这个词来区分他和 Norbert Wiener(一位比较年迈的麻省理工学院的教授)的研究。Wiener 发明了控制论(cybernetics)来代指他自己设想的智能系统,这种视野和运筹学、统计、模式识别、信息论、控制理论(control theory)是密切相关的。McCarthy 则是选择了和逻辑的链接。有趣的是,Wiener 的构想最终在现代统治了这个领域,却被冠以 McCarthy 使用的词汇。(当然了,这种事情只是暂时的,人工智能研究的变化节奏比大多数领域都要更快)

但是,我们需要放下这两种历史观点。

我们需要意识到现在所发生的关于人工智能的公众对话,只关注到工业界和学术界的一个很小的子集。这可能会让我们变得短视,无法看到人工智能、智能强化、智能基建里的挑战和机会。

这些挑战与机会和实现科幻小说里的美好设想或者灾难性后果无关。相反地,它们关注的是人类在这些技术变得更加现实,更加有影响力的时候,如何更好地去理解和塑造它们。而且,在这个理解和塑造的过程中,不仅仅只有科技行业的人,各行各业的人都需要发出他们的声音。而狭隘地关注”类人智能“会让我们错过很多重要的观点。

工业界会持续地推动很多这样的发展,而学术界也会持续地发挥一个核心的作用。学术界不仅需要提供一些最创新的技术想法,也需要计算和统计学科的学者以及其他学科的学者一起合作,尤其重要的是社会科学、认知科学、人文学科的学者。

另一方面,虽然人文和科学都是我们前进道路上不可或缺的,我们应该认识到我们在讨论的是一个规模和范围都属于前所未有的的巨大工程问题:整个社会在尝试在建造一些新的人造物。这些人造物需要具有我们所希望的效果。我们不想建造出一大堆医疗选择,交通选择,和商务机会的系统,最终才发现这些系统是无效的,甚至发现它们做出了一些错误决策,而其代价为人类的快乐乃至生命。在这方面,正如我所强调的一般,有一个即将出现的以数据为核心,专注于学习的工程领域。虽然已经有很多令人兴奋的发展,但这些内容尚未能够被视作构成了一个完整的工程学科。

更进一步地,我们要去接受这样一个事实:我们正在见证的,是一个崭新的工程分支的诞生。“工程”这个词汇,通常被以一种狭义的方式提起,不管在学术界里,还是学术界外,它听起来都冷冰冰的,如同一个没有感情的机器,并且有时会让人想象出一副失去控制的画面。但是,一个工程分支,可以是任何我们想要它成为的东西。

在这个年代,我们有一个真实的见证全新历史的机会:一个围绕着人类本身展开的工程分支。

我不想给这个新生的领域一个名字,但如果“人工智能”这个词一直被用作指代这个领域的专有名词,那我们需要谨慎地看待这个词的局限性。让我们打开我们的视野,从狂热中冷静下来,并且意识到前方的严峻挑战。

迈克尔·乔丹

作者致谢:在写作的过程中,有很多人给了非常多的帮助,这其中包括了杰夫·贝佐斯,大卫·布雷,罗德·布鲁克斯,凯瑟琳·卡森,汤姆·迪特里奇,查理斯·埃尔坎,奥伦·艾特齐尔尼,大卫·海克曼,道格拉斯·豪富斯塔德,迈克尔·启恩斯,塔米·科尔达,爱德·拉佐斯卡,约翰·马科夫,依瑟·洛尔福,马佳·马塔力科,狄米崔斯·帕派力奥普鲁斯,本·雷切特,西尔多罗斯·莱卡斯纳斯,芭芭拉·洛萨里奥,和埃恩·斯托卡。我想再对 The House 的卡梅隆·巴拉达特别致谢,他是第一个鼓励我去写这篇文章的人。

本文转载自公众号蚂蚁金服科技(ID:Ant-Techfin)。

原文链接:

https://mp.weixin.qq.com/s/OQ638HqVsWcKqbbHXv_wWQ

评论

发布