2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

谷歌联合斯坦福推出可解释 AI 新方法,揭秘图像分类器到底是如何工作的

  • 2019-10-15
  • 本文字数:983 字

    阅读完需:约 3 分钟

谷歌联合斯坦福推出可解释AI新方法,揭秘图像分类器到底是如何工作的

当 AI 系统变得越来越益复杂,它的可解释性通常会变得越来越差。不过业内已经涌现了不少研究成果来挑战这个难题,比如 Facebook 的研究人员推出了Captum库,该库可以解释基于深度学习框架 PyTorch 的神经网络是如何做决定的,同类型的研究还有 IBM 的AI Explainability 360工具包和 Microsoft 的InterpretML。为了使 AI 的决策更加透明,来自 Google 和 Stanford 的团队最近开发了一种新的机器学习模型:Automated Concept-based Explanation(ACE),该模型可以自动提取用来预测模型且“对人类有意义”的视觉概念。



Google 的 ACE 模型能够区分出影响图像分类器决策的不同特征。


研究人员在近日发布的论文中对这项工作进行了详细的说明。他们认为,当前大多数机器学习解释方法为了评估不同特征(例如像素、超像素、词向量)对目标模型的重要性,会对各个特征做一些修改。这种方法并不完善,即使输入出现非常微小的变化,它也很容易受到攻击。


相比之下,ACE 在提取概念并确定每个概念的重要性之前,通过将经过训练的分类器和同一分类中的一组图像作为输入来识别更高级别的概念。具体来说,ACE 将具不同分辨率的图像进行分割,从而捕获不同的纹理、物体部分和物体,然后再将相似的分割片段分组,作为同一概念的示例,最终返回对决策最重要的概念。



对于三种不同的 ImageNet 分类,ACE 的输出结果。


为了测试 ACE 的鲁棒性,该团队使用 Google 的 Inception-V3 图像分类器模型在 ImageNet 数据集上进行训练,并从数据集的 1,000 个类别中选择了 100 个类别的子集来应用 ACE。


测试结果表明,被 ACE 模型标记为重要的概念倾向于遵循人类的直觉,例如,对于警车的图像分类器来说,执法徽标比地面上的沥青更重要。但是,情况并非总是如此。在另一个例子里,对于预测篮球图像的分类器来说,最重要的概念是球员的球衣而不是篮球本身;而当对旋转木马做分类的时候,木马上的灯光比座位和竖杆更可能影响分类的结果。


当然,目前 ACE 还远远不够完美,它难以有效地提取异常复杂或困难的概念。但是研究人员认为,这一研究提出了模型学习关联性的新方法,可能会让机器学习的使用变得更加安全。


“我们通过人类实验验证了这个方法的意义和一致性,并进一步验证了它确实对于模型预测有重要意义。[我们的]方法能够自动将输入的特征分组为高级概念;这些概念作为连续的示例出现,对于正确预测图像中存在的物体非常重要。”研究人员表示。


2019-10-15 12:372148
用户头像
蔡芳芳 InfoQ 总编辑

发布了 819 篇内容, 共 621.4 次阅读, 收获喜欢 2823 次。

关注

评论

发布
暂无评论
发现更多内容

KWDB 开发站重磅上线!解锁 KWDB 开发资源宝库

KaiwuDB

数据库 KaiwuDB 分布式多模数据库 KWDB开源数据库

DolphinScheduler 3.1.9 单机版重启后,项目、流程定义等数据全部丢失

白鲸开源

大数据 开源 Apache DolphinScheduler 工作流任务调度

新兴数据湖仓手册·从分层架构到数据湖仓架构(2025):数据仓库分层的概念与设计

白鲸开源

大数据 数据仓库 数据湖 白鲸开源 WhaleStudio

商城程序搭建B2B2C平台的物流轨迹信息展示之在途监控API

快递鸟

Dify 企业版 vs. 社区版:为规模化应用构建而生的企业级优势解析

伊克罗德信息科技

价格战拼到尽头,天润融通ZENAVA才是家电品牌的增长新引擎

天润融通

连锁餐饮拓展微信业务:试错 3 个月,终于找到靠谱方案

微擎应用市场

AI Coding实现X2SeaTunnel的设计、开发与落地

白鲸开源

大数据 开源 数据同步 Apache SeaTunnel AI编程

ECRobot 深耕 AI 应用场景落地!伊克罗德信息成功签约两大行业标杆客户

伊克罗德信息科技

场地预约系统:数字化预约管理新生态,驱动场地运营高效协同

深圳亥时科技

【IEEE出版】第四届云计算、大数据应用与软件工程国际学术会议 (CBASE 2025)

搞科研的小刘

云计算 大数据 软件工程

天润融通客户联络,如何成为企业AI转型的“黄金切入口”?

天润融通

Dify vs. n8n:专才与通才的对决,为何AI应用开发首选Dify?

伊克罗德信息科技

2025年第二季度移动网络威胁报告深度解析

qife122

移动安全

吃透 DolphinScheduler 负载均衡:3 大核心算法 + 底层逻辑全解析

白鲸开源

大数据 开源 算法 Apache DolphinScheduler 数据调度

重磅来袭:2026智博会|世亚智博会|杭州智博会

AIOTE智博会

智博会 人工智能展 世亚智博会 杭州智博会

【IEEE出版】第四届能源互联网及电力系统国际学术会议(ICEIPS 2025)

搞科研的小刘

能源互联网 国际学术会议 电力系统

如何利用海外社交媒体监测工具提升品牌影响力?

沃观Wovision

跨境电商 社交媒体 沃观Wovision 舆情监测系统 海外舆情监测

Dify企业版 vs. n8n企业版:企业数智化战略的核心抉择

伊克罗德信息科技

低代码+AI 建表设计实操,无脑实现5分钟做一张表单

引迈信息

为何底层数据湖决定了 AI Agent 的上限?

字节跳动数据平台

全国独家线下面授 | 大规模敏捷LeSS认证上海12月18-20日【报名享多重福利优惠】

ShineScrum

LeSS认证 CLP认证 LeSS认证实践者

ChatBI如何重塑企业数据分析?2025年智能BI行业趋势解读

飞鲤

数据分析 BI BI 分析工具 ChatBI

追觅的想象空间:以技术为翼,向生态无垠

慢点科技SlowTech

代码·创想·未来——百度文心快码创意探索Meetup来啦

Comate编码助手

工程师 AI 编程 文心快码 AI编程助手

用了天润融通AI之后才知道,原来以前的客服真苦

天润融通

“一切皆文件”:揭秘LINUX I/O与虚拟内存的底层设计哲学

poemyang

Linux RPC I/O模型

最佳实践:基于Apache SeaTunnel从MySQL同步到PostgreSQL

白鲸开源

MySQL postgresql 大数据 开源 Apache SeaTunnel

“全球金牌课程”11月08-09日·上海线下·CSM认证【提前报名特惠

ShineScrum

Scrum Master CSM CSM认证 CSM认证培训

语音识别技术实战:从iOS到GPT的优化之路

qife122

自然语言处理 语音识别

敏捷VMO:打通战略到成果的桥梁,驱动企业规模化敏捷转型

ShineScrum

敏捷 PMO VMO

谷歌联合斯坦福推出可解释AI新方法,揭秘图像分类器到底是如何工作的_AI&大模型_蔡芳芳_InfoQ精选文章