你在使用哪种编程语言?快来投票,亲手选出你心目中的编程语言之王 了解详情
写点什么

增量式物体检测

2020 年 5 月 16 日

增量式物体检测

【摘要】 当前主流的目标检测器模型在训练时即确定了需要检测的物体种类,如果想要增加新的类别,只能重新训练。本文介绍了一种增量式的物体检测模型,可以随时增加新的类别,更符合实际场景。


文章信息:Konstantin Shmelkov, Cordelia Schmid, Karteek Alahari. Incremental Learning of Object Detectors without Catastrophic Forgetting. ICCV 2017.


文章主要介绍一种针对深度学习中物体检测任务的增量式学习方法。具体来说,问题的设置为:假设在一开始的时候已经有了一个用一些数据训练得到的物体检测模型;之后又有一批新的数据,这批数据上只标注了新的、未见过的类别的 bounding box 和类别,增量式物体检测方法的目标是在已有模型的基础上,学习一个新的模型,可以同时检测之前的类别和新类别的物体。


这个设置的难点在于,如果不对方法进行特殊的设计,而只使用新的数据更新模型,则模型在原来的类别上的表现会非常差,这个现象被称作“灾难性遗忘”。为了解决这个问题,作者提出将原始模型中的知识“蒸馏”出来,并在更新模型的时候既对新类别进行学习,也对这部分蒸馏出来的知识进行学习,从而保证模型不会遗忘已有的知识。



具体来说,该方法的模型设计如上图所示。本文中,为了保证候选的 region proposal 不是针对原有模型中特定的类别,而是针对通用的物体,方法的基本架构基于 Fast RCNN。当更新模型的时候,需要两个版本的模型,其中上路的 Network A 为原始的模型(模型参数完全固定,不进行调整),下路的 Network B 为可以更新的模型。模型的整体流程如下:


  1. 以新类别的图像作为 Network A 的输入,从背景得分最低(即物体得分最高)的 128 个 RoI 中随机选取 64 个,并在 Network B 中计算这 64 个 RoI 的预测输出(包括分类预测的 logits 和 bounding box regression 输出),约束 Network B 的预测输出和相应的 Network A 的预测输出相同(使用 L2 损失进行约束,忽略 Network B 中对应新类别的输出项)。通过约束新模型在已有类别上的输出和旧模型在已有类别上的输出相同,保证旧类别的知识可以迁移到新模型上;

  2. 针对新增的类别,使用标准的 Fast RCNN 损失进行训练。


从实验结果来看,相比于在具有完整标注的全部数据上的模型训练的方式来说,增量式物体检测方法在性能上有一定的下降,但是相比于不考虑“灾难性遗忘”问题的方案有明显的提升。


2020 年 5 月 16 日 16:43866

评论

发布
暂无评论
发现更多内容

架构师训练营第三周作业

文智

极客大学架构师训练营

c++杂谈4

菜鸟小sailor 🐕

【FastDFS】SpringBoot整合FastDFS实战,我只看这一篇!!

冰河

springboot fastdfs

FastDFS 分布式文件系统详解

哈喽沃德先生

文件系统 分布式文件存储 fastdfs 分布式文件

数字货币视域下的金融安全实现路径

CECBC区块链专委会

区块链 数字货币

jdk 源码系列之StringBuilder、StringBuffer

sinsy

Java jdk 源码解析

Greenplum 性能优化之路 --(三)ANALYZE

小小的一朵云

大数据 数据仓库

Java源码系列2——HashMap

超超不会飞

Java

智能体的奇幻漂流之“成都折叠”篇

脑极体

高中生写LOL外挂1年狂赚五百万,落网前刚买下120万保时捷

Java架构师迁哥

架构师训练营第1期第3周作业

业哥

极客大学架构师训练营

一个好系统自我完善自我进化的方法

boshi

产品思维 系统工程 即时反馈 生态体系

Greenplum 性能优化之路 --(二)存储格式

小小的一朵云

大数据

第二周-命题作业

莫森

极客大学架构师训练营

LeetCode题解:641. 设计循环双端队列,使用双向链表,JavaScript,详细注释

Lee Chen

LeetCode 前端进阶训练营

揭开500亿“区块链”骗局

CECBC区块链专委会

法律 传销

手把手教你:将 ClickHouse 集群迁至云上

小小的一朵云

大数据 Clickhouse

Greenplum 性能优化之路 --(一)分区表

小小的一朵云

大数据

架构师训练营第三周作业

邓昀垚

极客大学架构师训练营

【架构笔记之设计模式】架构师训练营第1期第3周

业哥

极客大学架构师训练营

经常使用的数据结构

hasWhere

腾讯云大数据发布最新产品矩阵,助力企业整合打通海量数据

小小的一朵云

大数据

用go语言实现快排

Sean

go 算法 快速排序

鲲鹏播种于时代,花开五色中原

脑极体

优秀组织的5大表现

异想的芦苇

团队管理 团队组织 组织

Java源码系列3——LinkedHashMap

超超不会飞

Java

联邦计算:不暴露真实数据如何完成合作建模?

小小的一朵云

大数据

CSS语法与规则 — 重学CSS

三钻

CSS 前端 前端进阶

致谢!华为全联接2020精彩回顾

华为云开发者社区

华为 华为云 智能 hdc

持续引领大数据行业发展,腾讯云发布全链路数据开发平台WeData

小小的一朵云

大数据

腾讯云副总裁刘煜宏:大数据平台算力弹性资源池达500万核,国内最强

小小的一朵云

大数据

PingCAP DevCon 现场直播

PingCAP DevCon 现场直播

增量式物体检测-InfoQ