大咖直播-鸿蒙原生开发与智能提效实战!>>> 了解详情
写点什么

AI 大牛沈向洋就职清华演讲全录:人类对 AI 如何做决定一无所知

  • 2020-03-06
  • 本文字数:3243 字

    阅读完需:约 11 分钟

AI大牛沈向洋就职清华演讲全录:人类对AI如何做决定一无所知

2019 年 11 月 14 日凌晨,在微软服务 23 年的微软全球执行副总裁沈向洋博士宣布离开微软;2020 年 3 月 5 日,清华大学在线上举行了活动“沈向洋双聘教授聘任仪式暨春风讲堂第四讲”,沈向洋博士离开微软后的首个去向得以确认。会后,沈向洋发表了主题为 “如何设计和构建负责任的 AI” 的全英文演讲,InfoQ 对重点内容进行了整理。


由于受到疫情影响,沈向洋教授无法到达现场,本次活动采用了两地连线直播的形式,通过清华大学春风讲堂的 B 站账号对外直播。2005 年,沈向洋曾以双聘教师的身份在清华任教,并于 2015 年参与了清华、华盛顿大学、微软共同成立的全球创新学院(GIX)。


因此,本次在线直播为续聘仪式,清华大学副校长杨斌主持了颁奖活动,校长邱勇在活动开始前进行了致辞,对沈向洋教授的加入表示欢迎。随后,沈向洋在致辞中表达了对中国人工智能发展的信心,同时也期待能够早日在清华园里,与师生们一起工作、生活。



清华大学校长邱勇向沈向洋正式颁发聘书


仪式过后,沈向洋进行了一次线上授课演讲,分享了他对 AI 可解释性与 AI 偏见相关问题的研究与看法。


由于演讲为全英文,InfoQ 整理了重点内容供广大开发者参考。

沈向洋:如何设计和构建负责任的 AI

话题 1:AI 的可解释性

之前,我们谈论的 AI 都是出现在科幻小说或电影里。实际上,AI 现在已经走进我们的日常生活,我们每天都在和 AI 打交道。但是,当这些 AI 应用到医疗、金融等领域中时,我们就需要更加谨慎地看待。


如今,AI 已经可以做决定,这是 AI 过程中非常重要的一步,这就引出了我的第一部分内容:我们缺乏对 AI 所做决定的认知。

我们缺乏对 AI 所做决定的认知

AI 就像一个黑匣子,它们能自己做出决定,但是我们并不清楚其中的缘由。所以,我们目前需要做的就是打开这个“黑匣子”,了解 AI 想表达的意思和可能会做出的决定。这就是我们今天演讲的主题:如何设计和构建负责任的 AI。



AI 的发展需要遵循一定的基本原则,包括公正、透明、可信赖 & 安全、隐私 & 安全、适用范围广泛、负责。


我们每次发现新的技术,都会面临同样的问题:如何让技术变得更加可靠、安全和负责任 。


举个例子,当人类在生产电气零部件时,都会有相应的检查记录。一旦哪里出现问题,就可以对操作文件进行复盘,从而找出问题。但是,AI 是不相同的,AI 没有这样的一张检修表,我们往往不知道是哪个环节出现了问题。

构建具有可解释性的 AI


上图是一张模型可解释性的变化图片,横轴代表模型的可解释能力,纵轴表示预测的准确性。从横轴来看,越向右边延伸,我们得到的模型的可解释性越大。从纵轴来看,越向上延伸,系统预测的准确性越高。很多年前,我们就已经使用了这种线性模式,只不过那时并不称之为 AI。


总之,模型是非常复杂的,解释起来十分困难。接下来,我们可以通过例子来证明下为什么这件事情如此复杂。

案例一:提取和比较

我们试图找出更多的数据来检测模型的准确度。2016 年,很多地方都推出了用于预测未来罪犯的软件,法庭在审判时已经开始用 AI 进行辅助判断。越是如此,人们就越会担心算法是否存在偏见,让我们通过一张图表来具体分析:



红色曲线代表从模型提取的情况,绿色曲线代表实际情况。例如,你是如何知道这个人将会再次犯罪呢?那这时来回顾下过去的数据,数据显示这个人有犯罪史,这个人过去犯得罪越多,以后就越有可能犯罪。这一定程度上与第一个图形显示的结果相吻合。



从图上可以看出,美国本土居民犯罪率较高,对应地,重新犯罪比率也更高(红色显示),但实际上绿线显示却与之相反,人们印象中非洲裔美国人很容易犯罪,但实际上也并非如此,也就是说尽管是基于事实进行预测,也存在着一定的偏见,所以在训练这种数据时要格外谨慎。

案例二:局部解释和与模型无关的解释

我们如何透过复杂的模型了解其中的内容呢?一个复杂的模型就像黑匣子一样,我们向里面输入一些东西,就会得到一些东西。我们之所以无法理解模型是因为模型本身就非常复杂,晦涩难懂。



有些人就会认为,这样难懂的模型就不追求整体解释,只需要局部可解释性,那么就会出现下列问题。



正如上图,模型的识别准确率已经可以达到 5/6,但是我仍然不知道我要什么,到底是哈士奇还是狼。如果需要的是一只哈士奇,却把狼带回家,那麻烦就大了。你以为训练了一个非常强大的模型,实际上并非如此,这就是我一直在强调的:模型的可解释性十分重要。

话题 2:AI 的偏见

案例一:对不同肤色的偏见

在任何时候,构建 AI 都离不开数据。需要了解偏见来自哪里,就需要知道数据的来源。在微软、IBM 和 Face ++ 制定的面部识别算法中,黑人女性比白人的面部识别准确率要低。




从上图可以看出,对黑色女性人脸识别的错误率高达了 21.073,很多人表示这是难以接受的。所以,我们对这个模型进行了调整。三个月后,模型改善后得到了如下结果:



可以看出,经过再次训练后的模型,在识别不同肤色人种时准确率明显提高,许多分类错误率已经为 0.000,即便是黑人女性,识别错误率也降低至 1.9008。从不断的训练中,我们得到结论:这种偏见来自于训练采用的样本数据。


基于以上问题,我们对微软 500 名机器学习领域工程师进行了调查,我们问他们如何改善机器学习系统?在经过调查后得出结论:如今机器学习工程师面临的最大问题之一是他们知道出了一些问题,但是不知道具体是哪里出了问题,也并不知道为什么会出现问题。



当我们训练一个复杂或简单的模型,最终得到的结论是准确率为 73.8%,再深究每个训练的数据集时会发现,不同的肤色和性别,得到的准确率是不一样的。一些结果还比较令人满意,但也有一些结果差强人意。



所以,我们构建了一个系统来进行对比,看到底是哪里出了问题。



传统机器学习系统是低级模式,而现在的模型带有错误可解释性,可以从整体视角,根据数据集不同的特征来判断哪里出现了问题,也可以从集群角度来了解到底为什么会出现这样的问题。基于这种模型,一旦出现问题时你可以复检样本数据集、模型来找出问题症结。

案例二:消除嵌入文本的偏见

我们使用了很多数据进行训练,列出了 27 种职业,包括会计、律师、教师、建筑师等。我们将一段话嵌入进去,然后发现系统识别出其职业为“教师”,但是,如果我们将段落中的某些单词进行修改,只改变很小的一部分 ,从“她”到“他”其他都没有改变,最终识别出的结果就从“教师”变成了“律师”。



这里就涉及到了文字嵌入几何学(如下图所示):



这个几何嵌入有两个属性:Proximity 和 Parallelism。我这里提出苹果和微软,大家就会联想到两家公司的成立者很伟大,都是很大的公司,这就是嵌入的内容。




根据上图可见,如果某个单词更向下邻近 He,则表示为他;如果某个单词更向上,邻近 She,则表示为她。横轴可以看出,单词越向右,就越与性别无关;越向左,越与性别相关,例如妻子和丈夫,爸爸和妈妈。这里还可以看出,很多时候谈及时髦,通常是形容女性,而说起杰出,通常用来形容男性。



那么,现在我们已经知道问题出在了哪里,就可以用上述模型来解决。但是,我们之后就会发现原来“时髦”、“杰出”、“天才”这类词语既可以形容男性,又可以形容女性。


我们已经进入了 AI 时代,我们的生活与 AI 息息相关,我们是接触 AI 的第一代人群,无论喜欢与否都别无选择,但是我们能决定该用何种方式来构建 AI 以及使用 AI。


最后,感谢大家收看!


附录:沈向洋简介


1996 年 11 月,沈向洋正式加入微软,并从此开始了在微软 23 年的职业生涯。作为在微软服务时间最长、职位最高的华人高管,23 年的时间里,沈向洋参与了许多重要的项目,也见证了微软发展的各个重要瞬间。


1999 年,沈向洋回到北京参与创立微软中国研究院,并担任微软亚洲研究院计算组主任研究员,高级研究员;2004 年,他升任第三任微软亚洲研究院院长,兼首席科学家;2007 年,沈向洋升任微软全球资深副总裁,之后在 2013 年成为微软全球执行副总裁。2019 年 11 月 14 日凌晨,在微软服务 23 年的沈向洋宣布离开微软。


沈向洋主要专注于计算机视觉、图形学、人机交互、统计学习、模式识别和机器人等方向的研究工作,是计算机视觉和图形学研究的世界级专家。


2020-03-06 09:052777

评论

发布
暂无评论
发现更多内容

HypeX Labs:充分释放加密资产的潜力

股市老人

低代码助力软件开发

树上有只程序猿

软件开发 低代码 可视化开发

性能测试中数据处理经验分享

FunTester

Linux远程管理工具

芯动大师

三江学院“火焰杯”软件测试高校就业选拔赛颁奖仪式

测试人

APE猿岛游戏系统开发(ApeCoin DAO)

薇電13242772558

NFT 链游

做开源九死一生!为什么还有那么多人前仆后继?

X2Rtc

开源 音视频 RTC 科技 十四五

Mojo——会燃的 AI 编程语言

CODING DevOps

INFINI Labs 产品更新 | Easysearch 优化字段压缩提升写入速度,Console 优化数据迁移和校验等功能

极限实验室

INFINI Console easysearch

如何使用 NFTScan 的 TON API 实现 NFT 应用开发?

NFT Research

NFT NFT\ NFTScan nft工具

腾讯云 CODING 快速应用中心,让您 10 分钟轻松玩转 AIGC

CODING DevOps

文心一言 VS 讯飞星火 VS chatgpt (117)-- 算法导论10.3 2题

福大大架构师每日一题

福大大架构师每日一题

亚太手游市场规模超百亿,华为游戏中心助力伙伴实现持续增长

最新动态

3DCAT实时云渲染赋能聚好看科技,打造3D沉浸式互动视频云平台

3DCAT实时渲染

云渲染 实时渲染 实时云渲染

手帐怎么做?推荐这10款手帐达人都在用的好用软件!

彭宏豪95

效率 科技 在线白板 办公软件 笔记软件

第4期 | GPTSecurity周报

云起无垠

Nautilus Chain 与 Coin98 生态达成合作,加速 Zebec 生态亚洲战略进程

西柚子

OPPO ColorOS,重建用户和折叠屏的“亲密关系”

脑极体

OPPO

Python 条件和 if 语句

小万哥

Python 程序员 软件 后端 开发

Nautilus Chain 与 Coin98 生态达成合作,加速 Zebec 生态亚洲战略进程

石头财经

风口之下的低代码革命

互联网工科生

低代码

酷克数据发布HD-SQL-LLaMA模型,开启数据分析“人人可及”新时代

酷克数据HashData

云原生数据库 GaiaDB 的核心技术演进和解析

Baidu AICLOUD

云原生数据库

观测云产品更新 | 优化 SSO 管理、新增监控器类型、优化场景等

观测云

数据可视化 单点登录 监控器

人工智能:科学、医疗、工业的未来之光

测吧(北京)科技有限公司

测试

Nautilus Chain 与 Coin98 生态达成合作,加速 Zebec 生态亚洲战略进程

BlockChain先知

国外服务器对网站速度的影响:事实与误解

一只扑棱蛾子

发现一不错的编程助手 Amazon CodeWhisperer

亚马逊云科技 (Amazon Web Services)

人工智能 CodeWhisperer 云上探索实验室

AI大牛沈向洋就职清华演讲全录:人类对AI如何做决定一无所知_AI&大模型_李冬梅_InfoQ精选文章