在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

谷歌联合斯坦福推出可解释 AI 新方法,揭秘图像分类器到底是如何工作的

  • 2019-10-15
  • 本文字数:983 字

    阅读完需:约 3 分钟

谷歌联合斯坦福推出可解释AI新方法,揭秘图像分类器到底是如何工作的

当 AI 系统变得越来越益复杂,它的可解释性通常会变得越来越差。不过业内已经涌现了不少研究成果来挑战这个难题,比如 Facebook 的研究人员推出了Captum库,该库可以解释基于深度学习框架 PyTorch 的神经网络是如何做决定的,同类型的研究还有 IBM 的AI Explainability 360工具包和 Microsoft 的InterpretML。为了使 AI 的决策更加透明,来自 Google 和 Stanford 的团队最近开发了一种新的机器学习模型:Automated Concept-based Explanation(ACE),该模型可以自动提取用来预测模型且“对人类有意义”的视觉概念。



Google 的 ACE 模型能够区分出影响图像分类器决策的不同特征。


研究人员在近日发布的论文中对这项工作进行了详细的说明。他们认为,当前大多数机器学习解释方法为了评估不同特征(例如像素、超像素、词向量)对目标模型的重要性,会对各个特征做一些修改。这种方法并不完善,即使输入出现非常微小的变化,它也很容易受到攻击。


相比之下,ACE 在提取概念并确定每个概念的重要性之前,通过将经过训练的分类器和同一分类中的一组图像作为输入来识别更高级别的概念。具体来说,ACE 将具不同分辨率的图像进行分割,从而捕获不同的纹理、物体部分和物体,然后再将相似的分割片段分组,作为同一概念的示例,最终返回对决策最重要的概念。



对于三种不同的 ImageNet 分类,ACE 的输出结果。


为了测试 ACE 的鲁棒性,该团队使用 Google 的 Inception-V3 图像分类器模型在 ImageNet 数据集上进行训练,并从数据集的 1,000 个类别中选择了 100 个类别的子集来应用 ACE。


测试结果表明,被 ACE 模型标记为重要的概念倾向于遵循人类的直觉,例如,对于警车的图像分类器来说,执法徽标比地面上的沥青更重要。但是,情况并非总是如此。在另一个例子里,对于预测篮球图像的分类器来说,最重要的概念是球员的球衣而不是篮球本身;而当对旋转木马做分类的时候,木马上的灯光比座位和竖杆更可能影响分类的结果。


当然,目前 ACE 还远远不够完美,它难以有效地提取异常复杂或困难的概念。但是研究人员认为,这一研究提出了模型学习关联性的新方法,可能会让机器学习的使用变得更加安全。


“我们通过人类实验验证了这个方法的意义和一致性,并进一步验证了它确实对于模型预测有重要意义。[我们的]方法能够自动将输入的特征分组为高级概念;这些概念作为连续的示例出现,对于正确预测图像中存在的物体非常重要。”研究人员表示。


2019-10-15 12:372210
用户头像
蔡芳芳 InfoQ 总编辑

发布了 851 篇内容, 共 631.8 次阅读, 收获喜欢 2826 次。

关注

评论

发布
暂无评论
发现更多内容

Playwright自动化测试系列课(3) | 第二阶段:核心技能与调试 ​​交互操作大全

测吧(北京)科技有限公司

鸿蒙开发中与 AI 编码助手的共处之道(ArkTS 视角)

谢道韫

统一多模态 Transformer 架构在跨模态表示学习中的应用与优化

申公豹

人工智能

中烟创新灯塔大模型应用开发平台入选工信部“政务大模型应用典型案例”

中烟创新

Couchbase 可观测性最佳实践

观测云

couchbase

javax.security.auth.login.LoginException: Message stream modified (41)

刘大猫

人工智能 数据挖掘 算法 数据分析 LoginException

踩过坑后,我发现了这几个运维神器

外滩运维专家

网站监控 免费SSL证书 监控电话 短信接口 免费监控

基于YOLOv8的太阳能电池片缺陷检测项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!

申公豹

yolov8

面试官:Dify如何调用外部程序?

王磊

烟草行业监管新利器:中烟创新案卷评审评查系统提速监管效能

中烟创新

关系型数据库有哪些?2025年主流选择与企业选型指南

镜舟科技

云原生 关系型数据库 数字化转型 大数据分析 StarRocks

三文带你轻松上手鸿蒙的 AI 语音 01-实时语音识别

最新动态

WebGL开发数字孪生框架

北京木奇移动技术有限公司

数字孪生 软件外包公司 webgl开发

2015年漏洞实验室课程公告 - CanSecWest与SyScan技术研讨会

qife122

漏洞利用 内核漏洞 内核漏洞模糊测试

云文档系统(源码+文档+讲解+演示)

深圳亥时科技

前维护与后维护LED屏的差异

Dylan

维护 LED显示屏 全彩LED显示屏 led显示屏厂家 户内led显示屏

性能提升 10 倍,零改造实现 DIFY 模式迁移至 Spring AI Alibaba 模式

阿里巴巴云原生

阿里云 云原生 Spring AI Alibaba

鸿蒙NEXT开发案例:世界时间表

最新动态

鸿蒙NEXT实战:构建社交应用新生态

最新动态

告别工具混战!TitanIDE,AI 开发者的全流程研发加速器

行云创新

模型开发训练 Cloud IDE TitanIDE 云端 IDE

区块链预付卡App的技术方案

北京木奇移动技术有限公司

区块链开发 软件外包公司 区块链支付

回顾Meltdown与Spectre漏洞披露事件:风险与启示

qife122

漏洞披露 侧信道攻击

音乐 NFT 软件系统的上线

北京木奇移动技术有限公司

数字藏品 软件外包公司 音乐NFT

面向多模态感知与反思的智能体架构Agentic AI的实践路径与挑战

申公豹

Agentic

鸿蒙NEXT实战:打造全能文件管理器应用

最新动态

三文带你轻松上手鸿蒙的 AI 语音 02-声音文件转文本

最新动态

Golang基础笔记十三之context

Hunter熊

Go 后端 Context 超时控制 传递数据

在AI时代,挖掘用户真实需求比技术实现更具挑战性

qife122

开源项目 需求分析

鸿蒙 开发黑科技:前端页面轻松调用 ArkTS 函数

最新动态

谷歌联合斯坦福推出可解释AI新方法,揭秘图像分类器到底是如何工作的_AI&大模型_蔡芳芳_InfoQ精选文章