写点什么

港科大联手思谋新作:Defect Spectrum 数据集重新定义 AI 工业质检

  • 2024-08-16
    北京
  • 本文字数:2049 字

    阅读完需:约 7 分钟

港科大联手思谋新作:Defect Spectrum 数据集重新定义AI工业质检

在“生产制造 - 缺陷检测 - 工艺优化 - 生产制造”的智能制造闭环链条中,基于 AI 的智能缺陷检测扮演着“把关者”的角色。但这个“把关者”长期以来却缺少样本量大、精度高、语义丰富的缺陷数据集。


近日,港科广和专注于智能制造领域的人工智能独角兽思谋科技联合发布了一篇论文,该论文提出了 Defect Spectrum 缺陷数据集及 DefectGen 缺陷生成模型,主攻工业智能检测,可解决模型无法识别的缺陷类别和位置问题,有效提升 10.74% 召回率,降低 33.1% 过杀率。


据悉在去年,该合作团队提出的《Ref-NeuS: Ambiguity-Reduced Neural Implicit Surface Learning for Multi-View Reconstruction with Reflection》被选为 ICCV 最佳论文候选。


Project Page: https://envision-research.github.io/Defect_Spectrum/


Arxiv Page: https://arxiv.org/abs/2310.17316


Github Repo: https://github.com/EnVision-Research/Defect_Spectrum


Dataset Repo: https://huggingface.co/datasets/DefectSpectrum/Defect_Spectrum


突破传统限制,


更贴近落地生产


高质量的数据集对 CV 技术和人工智能的发展起着至关重要的作用。如 ImageNet 不仅推动了算法的创新,还促进产业发展和进步。


在工业界,MVTec、VISION VI、DAGM2007 等数据集帮助视觉学习算法更接近工业生产实际场景,但由于样本量、精度、语义描述的不足,始终限制着 AI 工业检测的发展。


Defect Spectrum 数据集带着突破传统缺陷检测界限的任务而来,为工业缺陷提供了详尽、语义丰富的大规模标注,首次实现了超高精度及丰富语义的工业缺陷检测。


相比其他工业数据集,“Defect Spectrum”数据集提供了 5438 张缺陷样本、125 种缺陷类别,并提供了像素级的细致标签,为每一个缺陷样本提供了精细的语言描述,实现了前所未有的性能突破。



相比其他工业数据集,Defect Spectrum 精准度更高、标注更丰富



Defect Spectrum 与其他数据集的数量、性质对比


从实际的工业生产来看,工厂对缺陷检测的要求细致,需要在控制缺陷件的同时保证收益率。然而,现有缺陷检测数据集常常缺乏应用所需的精确度和语义丰富性,无法良好支持实际生产。


例如,一件衣服的拉链齿出现了错位,虽然缺陷尺寸不大但却影响衣物功能,导致拉链无法正常使用,消费者不得不将其退回工厂进行修复。然而,如果缺陷发生在衣物的面料上,比如轻微的钩丝或颜色略有差异,这时就需要仔细权衡其尺寸和影响。小规模的面料缺陷可被归类在可接受的范围内,允许这些产品通过不同的分销策略销售,比如以打折价格进行销售,在不影响整体质量的同时保有收益。


传统数据集如 MVTEC 和 AeBAD 尽管提供了像素级的标注,但常常局限于 binary mask,无法细致区分缺陷类型和位置。Defect Spectrum 数据集通过与工业界四大基准的合作,重新评估并精细化已有的缺陷标注,对细微的划痕和凹坑进行了更精确的轮廓绘制,且通过专家辅助填补了遗漏的缺陷,确保了标注的全面性和精确性。


通过 Defect Spectrum 数据集这个强大的工具,工厂缺陷检测系统能够迅速识别、立即标记,并采取相关修复策略。


革命性生成模型,专攻缺陷样本不足


港科大和思谋科技研究团队还提出了缺陷生成模型 Defect-Gen,一个两阶段的基于扩散的生成器。



Defect-Gen 两阶段生成流程示意图


Defect-Gen 专门解决当前数据集中缺陷样本不足的问题,通过利用极少量的工业缺陷数据生成图像与像素级缺陷标签,即使在有限的数据集上也能工作,为 AI 在复杂工业环境中的应用开辟了新的可能。


Defect-Gen 具体通过两个关键方法提高图像的多样性和质量:一是使用 Patch 级建模,二是限制感受野。


为弥补 Patch 级建模在表达整个图像结构上的不足,研究团队首先在早期步骤中使用大感受野模型捕捉几何结构,然后在后续步骤中切换到小感受野模型生成局部 Patch,可在保持图像质量的同时,显著提升了生成的多样性。通过调整两个模型的接入点和感受野,模型在保真度和多样性之间实现了良好的平衡。而生成数据同样可以作为数据飞轮的一部分,并加速其运转。


目前,Defect Spectrum 数据集的 5438 张缺陷样本中,有 1920 张由 Defect-Gen 生成。研究团队对应用 Defect-Gen 生成模型的 Defect Spectrum 数据集进行了全面的评估,验证了 Defect Spectrum 在各种工业缺陷检测挑战中的适用性和优越性。



部分缺陷检测网络在 Defect Spectrum 数据集上的测评结果



Defect Spectrum 数据集上的实际评估标准



Defect Spectrum 在实际评估中的优异表现


比起原有的数据集,在 Defect Spectrum 数据集上训练的模型召回率 (recall) 提升 10.74%,过杀率 (False Positive Rate) 降低了 33.1%。


据介绍,Defect Spectrum 数据集的引入可以让缺陷检测系统更加贴近实际生产需求,实现高效、精准的缺陷管理,同时为未来的预测性维护提供了宝贵的数据支持,通过记录每个缺陷的类别和位置,工厂可以不断优化生产流程,改进产品修复方法,最终实现更高的生产效益和产品质量。


目前 Defect Spectrum 数据集已应用于思谋科技缺陷检测视觉模型的预训练中,未来将与 IndustryGPT 等工业大模型融合,深度落地并服务于工业质检业务。


2024-08-16 18:4910511

评论

发布
暂无评论
发现更多内容

产品经理第四周

克比

黑客练手入门| pwnable.kr—幼儿瓶—02:collision

BigYoung

安全 CTF PWN 28天写作 2月春节不断更

写在“28天坚持写作活动”的最后一天

JiangX

28天写作

管理笔记[8]:管理中的聚势、借力与计划

L3C老司机

【LeetCode】子数组的最大平均数

Albert

算法 LeetCode 2月春节不断更

数据主权,才是业务在线化的核心

boshi

数据 数字资产 七日更

如果非要在多线程中使用ArrayList会发生什么?

看山

线程安全

机器学习笔记之:Matrix Vector Multiplication

Nydia

浪潮云洲工业互联网平台创新实践,受权威机构关注!

工业互联网

阿里Java面试脑图遭公开,GitHub上已获赞79.6K

Java架构师迁哥

智能汽车颠覆世界!(28天写作 Day28/28)

mtfelix

28天写作 智能汽车 未来世界

《我们一起学集合》-LinkedList

蚊子

Java 数据结构 面试 集合 linkedlist

产品训练营第二周作业-利益相关者

马悦

产品 产品经理训练营

开发质量系列:系统运营必须派人常驻机房吗?

罗小龙

最佳实践 方法论 28天写作 2月春节不断更

28天瞎写的第二百三十八天:这一年干了啥?

树上

28天写作

怎么一本正经地秀技

codevald

Java jdk

下不了的开人的手

Ian哥

28天写作

CDN加速原理的那些事

“嗖”一下28 天过去啦,我们都在交作业!

李忠良

28天写作

Linux Lab 进阶: Linux 内核

贾献华

Linux Linux Kenel 内核

谈谈我所理解的科幻「-28/28」

道伟

28天写作

Linux 文件搜索神器 find 实战详解,建议收藏!

鞋子特大号

Linux find

深入Linux内核之自旋锁spinlock_t机制

赖猫

c++ Linux内核

28天写作

lidaobing

28天写作

28天写作复盘

一笑

28天写作

养成好习惯,需要的不只是意志力

Justin

习惯养成 碎碎念 28天写作

MyBatis入门

小马哥

Java mybatis 七日更 2月春节不断更

【Linux系统】一个常驻进程问题的再次分析

程序员架构进阶

Linux 七日更 28天写作 2月春节不断更 共享内存

有用的信息安全资质查询网站大全

石君

信息安全 28天写作

面试时遇到一致性哈希算法这样回答会让面试官眼前一亮

中间件兴趣圈

负载均衡 面试 一致性哈希

ThreadLocal 类以及应用技巧

武哥聊编程

Java 多线程 ThreadLocal 28天写作

港科大联手思谋新作:Defect Spectrum 数据集重新定义AI工业质检_AI&大模型_褚杏娟_InfoQ精选文章