写点什么

AI 大牛沈向洋就职清华演讲全录:人类对 AI 如何做决定一无所知

  • 2020-03-06
  • 本文字数:3243 字

    阅读完需:约 11 分钟

AI大牛沈向洋就职清华演讲全录:人类对AI如何做决定一无所知

2019 年 11 月 14 日凌晨,在微软服务 23 年的微软全球执行副总裁沈向洋博士宣布离开微软;2020 年 3 月 5 日,清华大学在线上举行了活动“沈向洋双聘教授聘任仪式暨春风讲堂第四讲”,沈向洋博士离开微软后的首个去向得以确认。会后,沈向洋发表了主题为 “如何设计和构建负责任的 AI” 的全英文演讲,InfoQ 对重点内容进行了整理。


由于受到疫情影响,沈向洋教授无法到达现场,本次活动采用了两地连线直播的形式,通过清华大学春风讲堂的 B 站账号对外直播。2005 年,沈向洋曾以双聘教师的身份在清华任教,并于 2015 年参与了清华、华盛顿大学、微软共同成立的全球创新学院(GIX)。


因此,本次在线直播为续聘仪式,清华大学副校长杨斌主持了颁奖活动,校长邱勇在活动开始前进行了致辞,对沈向洋教授的加入表示欢迎。随后,沈向洋在致辞中表达了对中国人工智能发展的信心,同时也期待能够早日在清华园里,与师生们一起工作、生活。



清华大学校长邱勇向沈向洋正式颁发聘书


仪式过后,沈向洋进行了一次线上授课演讲,分享了他对 AI 可解释性与 AI 偏见相关问题的研究与看法。


由于演讲为全英文,InfoQ 整理了重点内容供广大开发者参考。

沈向洋:如何设计和构建负责任的 AI

话题 1:AI 的可解释性

之前,我们谈论的 AI 都是出现在科幻小说或电影里。实际上,AI 现在已经走进我们的日常生活,我们每天都在和 AI 打交道。但是,当这些 AI 应用到医疗、金融等领域中时,我们就需要更加谨慎地看待。


如今,AI 已经可以做决定,这是 AI 过程中非常重要的一步,这就引出了我的第一部分内容:我们缺乏对 AI 所做决定的认知。

我们缺乏对 AI 所做决定的认知

AI 就像一个黑匣子,它们能自己做出决定,但是我们并不清楚其中的缘由。所以,我们目前需要做的就是打开这个“黑匣子”,了解 AI 想表达的意思和可能会做出的决定。这就是我们今天演讲的主题:如何设计和构建负责任的 AI。



AI 的发展需要遵循一定的基本原则,包括公正、透明、可信赖 & 安全、隐私 & 安全、适用范围广泛、负责。


我们每次发现新的技术,都会面临同样的问题:如何让技术变得更加可靠、安全和负责任 。


举个例子,当人类在生产电气零部件时,都会有相应的检查记录。一旦哪里出现问题,就可以对操作文件进行复盘,从而找出问题。但是,AI 是不相同的,AI 没有这样的一张检修表,我们往往不知道是哪个环节出现了问题。

构建具有可解释性的 AI


上图是一张模型可解释性的变化图片,横轴代表模型的可解释能力,纵轴表示预测的准确性。从横轴来看,越向右边延伸,我们得到的模型的可解释性越大。从纵轴来看,越向上延伸,系统预测的准确性越高。很多年前,我们就已经使用了这种线性模式,只不过那时并不称之为 AI。


总之,模型是非常复杂的,解释起来十分困难。接下来,我们可以通过例子来证明下为什么这件事情如此复杂。

案例一:提取和比较

我们试图找出更多的数据来检测模型的准确度。2016 年,很多地方都推出了用于预测未来罪犯的软件,法庭在审判时已经开始用 AI 进行辅助判断。越是如此,人们就越会担心算法是否存在偏见,让我们通过一张图表来具体分析:



红色曲线代表从模型提取的情况,绿色曲线代表实际情况。例如,你是如何知道这个人将会再次犯罪呢?那这时来回顾下过去的数据,数据显示这个人有犯罪史,这个人过去犯得罪越多,以后就越有可能犯罪。这一定程度上与第一个图形显示的结果相吻合。



从图上可以看出,美国本土居民犯罪率较高,对应地,重新犯罪比率也更高(红色显示),但实际上绿线显示却与之相反,人们印象中非洲裔美国人很容易犯罪,但实际上也并非如此,也就是说尽管是基于事实进行预测,也存在着一定的偏见,所以在训练这种数据时要格外谨慎。

案例二:局部解释和与模型无关的解释

我们如何透过复杂的模型了解其中的内容呢?一个复杂的模型就像黑匣子一样,我们向里面输入一些东西,就会得到一些东西。我们之所以无法理解模型是因为模型本身就非常复杂,晦涩难懂。



有些人就会认为,这样难懂的模型就不追求整体解释,只需要局部可解释性,那么就会出现下列问题。



正如上图,模型的识别准确率已经可以达到 5/6,但是我仍然不知道我要什么,到底是哈士奇还是狼。如果需要的是一只哈士奇,却把狼带回家,那麻烦就大了。你以为训练了一个非常强大的模型,实际上并非如此,这就是我一直在强调的:模型的可解释性十分重要。

话题 2:AI 的偏见

案例一:对不同肤色的偏见

在任何时候,构建 AI 都离不开数据。需要了解偏见来自哪里,就需要知道数据的来源。在微软、IBM 和 Face ++ 制定的面部识别算法中,黑人女性比白人的面部识别准确率要低。




从上图可以看出,对黑色女性人脸识别的错误率高达了 21.073,很多人表示这是难以接受的。所以,我们对这个模型进行了调整。三个月后,模型改善后得到了如下结果:



可以看出,经过再次训练后的模型,在识别不同肤色人种时准确率明显提高,许多分类错误率已经为 0.000,即便是黑人女性,识别错误率也降低至 1.9008。从不断的训练中,我们得到结论:这种偏见来自于训练采用的样本数据。


基于以上问题,我们对微软 500 名机器学习领域工程师进行了调查,我们问他们如何改善机器学习系统?在经过调查后得出结论:如今机器学习工程师面临的最大问题之一是他们知道出了一些问题,但是不知道具体是哪里出了问题,也并不知道为什么会出现问题。



当我们训练一个复杂或简单的模型,最终得到的结论是准确率为 73.8%,再深究每个训练的数据集时会发现,不同的肤色和性别,得到的准确率是不一样的。一些结果还比较令人满意,但也有一些结果差强人意。



所以,我们构建了一个系统来进行对比,看到底是哪里出了问题。



传统机器学习系统是低级模式,而现在的模型带有错误可解释性,可以从整体视角,根据数据集不同的特征来判断哪里出现了问题,也可以从集群角度来了解到底为什么会出现这样的问题。基于这种模型,一旦出现问题时你可以复检样本数据集、模型来找出问题症结。

案例二:消除嵌入文本的偏见

我们使用了很多数据进行训练,列出了 27 种职业,包括会计、律师、教师、建筑师等。我们将一段话嵌入进去,然后发现系统识别出其职业为“教师”,但是,如果我们将段落中的某些单词进行修改,只改变很小的一部分 ,从“她”到“他”其他都没有改变,最终识别出的结果就从“教师”变成了“律师”。



这里就涉及到了文字嵌入几何学(如下图所示):



这个几何嵌入有两个属性:Proximity 和 Parallelism。我这里提出苹果和微软,大家就会联想到两家公司的成立者很伟大,都是很大的公司,这就是嵌入的内容。




根据上图可见,如果某个单词更向下邻近 He,则表示为他;如果某个单词更向上,邻近 She,则表示为她。横轴可以看出,单词越向右,就越与性别无关;越向左,越与性别相关,例如妻子和丈夫,爸爸和妈妈。这里还可以看出,很多时候谈及时髦,通常是形容女性,而说起杰出,通常用来形容男性。



那么,现在我们已经知道问题出在了哪里,就可以用上述模型来解决。但是,我们之后就会发现原来“时髦”、“杰出”、“天才”这类词语既可以形容男性,又可以形容女性。


我们已经进入了 AI 时代,我们的生活与 AI 息息相关,我们是接触 AI 的第一代人群,无论喜欢与否都别无选择,但是我们能决定该用何种方式来构建 AI 以及使用 AI。


最后,感谢大家收看!


附录:沈向洋简介


1996 年 11 月,沈向洋正式加入微软,并从此开始了在微软 23 年的职业生涯。作为在微软服务时间最长、职位最高的华人高管,23 年的时间里,沈向洋参与了许多重要的项目,也见证了微软发展的各个重要瞬间。


1999 年,沈向洋回到北京参与创立微软中国研究院,并担任微软亚洲研究院计算组主任研究员,高级研究员;2004 年,他升任第三任微软亚洲研究院院长,兼首席科学家;2007 年,沈向洋升任微软全球资深副总裁,之后在 2013 年成为微软全球执行副总裁。2019 年 11 月 14 日凌晨,在微软服务 23 年的沈向洋宣布离开微软。


沈向洋主要专注于计算机视觉、图形学、人机交互、统计学习、模式识别和机器人等方向的研究工作,是计算机视觉和图形学研究的世界级专家。


2020-03-06 09:052741

评论

发布
暂无评论
发现更多内容

开放YashanDB数据库的功能与特性介绍

数据库砖家

中烟创新为千行百业客户免费部署DeepSeek,让AI应用遍地开花

中烟创新

这5种规则引擎,真香!

电子尖叫食人鱼

前端 开发

常用YashanDB命令与操作实例

数据库砖家

MySQL为什么有时候会选错索引?

电子尖叫食人鱼

MySQL 数据库

Java集合框架性能特征与使用场景深度解析

不在线第一只蜗牛

Java

深度解析 DApp 开发:从技术架构到商业落地的全链路解决

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

成功的DApp经济模型中治理代币与功能代币的协同机制解析

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 公链开发代币开发

SketchUp Pro 2020 for Mac(草图大师)

晨光熹微

Studio One 7 Pro for mac(音乐创作编辑软件)

晨光熹微

灯塔低代码开发平台与DeepSeek深度融合,共筑AI编程的星辰大海

中烟创新

治理代币的质押周期应该如何科学设定?

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 代币开发 代币开发公链开发

一颗车灯的智能化之旅

脑洞汽车

AI

数智焕新!用友BIP交出央国企价值替代新答卷

用友BIP

重塑法律服务新生态,AlphaGPT筑牢法律AI数据安全防线

科技汇

订单初版—取消订单链路中的技术问题说明文档

量贩潮汐·WholesaleTide

Java 数据库 服务器

对初学者来说,YashanDB数据库的学习路线图

数据库砖家

ColorWell for Mac(调色板软件)

晨光熹微

苏超如何带火了5G-A?

脑极体

AI

SketchUp Pro 2024 for mac(su草图大师 专业的3D建模软件)

晨光熹微

错误码502终结指南:3步根除MCP加载失败难题​​

聚客AI学院

人工智能 MCP MCP协议 MCP Server MCP头号玩家

快速入门YashanDB数据库:安装配置全流程

数据库砖家

贝锐向日葵、ToDesk、网易UU远程、RayLink,四款远控软件暑假用哪款?

科技热闻

iCourt重启“律师大航海”计划,2024年美国行扬帆起航

科技汇

用友BIP企业AI全栈云:为中企出海筑牢全球化运营底座

用友BIP

Murus Pro for mac(网络安全防火墙工具)

晨光熹微

从语音识别到智能助手:Voice Agent 的技术进化与交互变革丨Voice Agent 学习笔记

声网

快速构建高效数据仓库:YashanDB数据库应用指南

数据库砖家

吉他初学者入门教程:Guitar Pro是如何帮助我从入门到大成的?

阿拉灯神丁

五线谱 吉他学习 吉他谱 Guitar Pro8 乐谱制作

引领国资监管新变革——国资国企穿透式监管白皮书重磅来袭

用友BIP

不同质押周期对代币价格稳定性的具体影响及数据支撑

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

AI大牛沈向洋就职清华演讲全录:人类对AI如何做决定一无所知_AI&大模型_李冬梅_InfoQ精选文章