谷歌联合斯坦福推出可解释AI新方法，揭秘图像分类器到底是如何工作的_AI&大模型_蔡芳芳_InfoQ精选文章

《HarmonyOS：领航者说》技术公开课来啦，大咖分享、实战解码，不容错过了解详情 



 写点什么

登录/注册

谷歌联合斯坦福推出可解释AI新方法，揭秘图像分类器到底是如何工作的

当 AI 系统变得越来越益复杂，它的可解释性通常会变得越来越差。不过业内已经涌现了不少研究成果来挑战这个难题，比如 Facebook 的研究人员推出了Captum库，该库可以解释基于深度学习框架 PyTorch 的神经网络是如何做决定的，同类型的研究还有 IBM 的AI Explainability 360工具包和 Microsoft 的InterpretML。为了使 AI 的决策更加透明，来自 Google 和 Stanford 的团队最近开发了一种新的机器学习模型：Automated Concept-based Explanation（ACE），该模型可以自动提取用来预测模型且“对人类有意义”的视觉概念。

Google 的 ACE 模型能够区分出影响图像分类器决策的不同特征。

研究人员在近日发布的论文中对这项工作进行了详细的说明。他们认为，当前大多数机器学习解释方法为了评估不同特征（例如像素、超像素、词向量）对目标模型的重要性，会对各个特征做一些修改。这种方法并不完善，即使输入出现非常微小的变化，它也很容易受到攻击。

相比之下，ACE 在提取概念并确定每个概念的重要性之前，通过将经过训练的分类器和同一分类中的一组图像作为输入来识别更高级别的概念。具体来说，ACE 将具不同分辨率的图像进行分割，从而捕获不同的纹理、物体部分和物体，然后再将相似的分割片段分组，作为同一概念的示例，最终返回对决策最重要的概念。

对于三种不同的 ImageNet 分类，ACE 的输出结果。

为了测试 ACE 的鲁棒性，该团队使用 Google 的 Inception-V3 图像分类器模型在 ImageNet 数据集上进行训练，并从数据集的 1,000 个类别中选择了 100 个类别的子集来应用 ACE。

测试结果表明，被 ACE 模型标记为重要的概念倾向于遵循人类的直觉，例如，对于警车的图像分类器来说，执法徽标比地面上的沥青更重要。但是，情况并非总是如此。在另一个例子里，对于预测篮球图像的分类器来说，最重要的概念是球员的球衣而不是篮球本身；而当对旋转木马做分类的时候，木马上的灯光比座位和竖杆更可能影响分类的结果。

当然，目前 ACE 还远远不够完美，它难以有效地提取异常复杂或困难的概念。但是研究人员认为，这一研究提出了模型学习关联性的新方法，可能会让机器学习的使用变得更加安全。

“我们通过人类实验验证了这个方法的意义和一致性，并进一步验证了它确实对于模型预测有重要意义。[我们的]方法能够自动将输入的特征分组为高级概念；这些概念作为连续的示例出现，对于正确预测图像中存在的物体非常重要。”研究人员表示。

评论

发布

暂无评论

QA进阶成长感悟录

成长内容合集签约计划第二季

Linux一学就会之Centos8软件包的管理和安装之yum管理软件包

Linux centos 运维 rpm yum

图数据和知识图谱，数字化转型的新引擎

图数据库知识图谱

大数据开发之数据读取—Pandas vs Spark

大数据 spark pandas

Apache ShenYu源码阅读系列-注册中心实现原理之Http注册

2021 China DevOpsDays演讲实录

DevOps DevOpsDays 签约计划第二季

「Oracle」Oracle 数据库备份还原

恒生LIGHT云社区

数据库 oracle

星环科技 TDH8.1.0：全新升级为用户带来极致体验

服务端质量保证体系(三) CI原子能力建设

ci 服务端质量保证签约计划第二季

java开发SSM框架整合之MyBatis动态SQL

mybatis ssm JAVA开发

Redis 分布式锁的正确实现原理演化历程与 Redisson 实战总结

redis RedLock redisson 分布式锁签约计划第二季

恒源云(GPUSHARE)_云GPU服务器如何使用PyCharm？

深度学习 gpu 算力加速

服务端质量保证体系(二) 流水线标准化建设

服务端 CI/CD 流程质量保证签约计划第二季

从源码分析快速实现对新开源软件的检测

华为云开发者联盟

二进制开源软件二进制SCA 特征

TDengine在雷达台站运维管理系统中的落地实践

数据库 tdengine 时序数据库

服务端质量保证体系(一) 全流程规范管理

服务端流程质量保证签约计划第二季

【分布式技术专题】「OSS中间件系列」Minio的Server端服务的架构和实战搭建

OSS Minio Minio 集群 12月日更 FS

Go语言学习查缺补漏ing Day3

恒生LIGHT云社区

Go 编程语言

少儿春晚表演

Hadoop完全分布式安装部署

大数据 hadoop

云原生时代的"应用级"多云管理

北京好雨科技有限公司

云计算 Kubernetes 容器多云管理

编程谜题：提升你解决问题的训练场

华为云开发者联盟

Python 编程编程语言代码编程谜题

开源机器学习数据库OpenMLDB贡献者计划全面启动

第四范式开发者社区

第四范式开源社区 OpenMLDB 机器学习数据库贡献者

python入门难？十之八九是因为python 协程吧！

梦想橡皮擦

Redis 很强，不懂使用规范就糟蹋了

redis Redis开发规范签约计划第二季

基于HTML、CSS和JS的年龄计算器

海拥(haiyong.site)

html 大前端 28天写作签约计划第二季 12月日更

入驻快讯｜欢迎字节跳动终端技术团队正式入驻 InfoQ 写作平台！

InfoQ写作社区官方

换个角度思考勒索攻击事件

华为云开发者联盟

漏洞勒索攻击安全检测蜜罐检测

华为AppCube入选Forrester《中国低代码平台市场分析报告》

华为云开发者联盟

华为低代码 AppCube 应用魔方 Forrester

前端开发框架react 之UmiJS

大前端 React

Redis 核心知识点归纳总结，从根上理解 Redis

redis Redis 核心技术与实战签约计划第二季