增量式物体检测_文化 & 方法_华为云开发者联盟_InfoQ精选文章

9月7日-8日，相约 2023 腾讯全球数字生态大会！聚焦产业未来发展新趋势！了解详情 



 写点什么

登录/注册

增量式物体检测

【摘要】当前主流的目标检测器模型在训练时即确定了需要检测的物体种类，如果想要增加新的类别，只能重新训练。本文介绍了一种增量式的物体检测模型，可以随时增加新的类别，更符合实际场景。

文章信息：Konstantin Shmelkov, Cordelia Schmid, Karteek Alahari. Incremental Learning of Object Detectors without Catastrophic Forgetting. ICCV 2017.

文章主要介绍一种针对深度学习中物体检测任务的增量式学习方法。具体来说，问题的设置为：假设在一开始的时候已经有了一个用一些数据训练得到的物体检测模型；之后又有一批新的数据，这批数据上只标注了新的、未见过的类别的 bounding box 和类别，增量式物体检测方法的目标是在已有模型的基础上，学习一个新的模型，可以同时检测之前的类别和新类别的物体。

这个设置的难点在于，如果不对方法进行特殊的设计，而只使用新的数据更新模型，则模型在原来的类别上的表现会非常差，这个现象被称作“灾难性遗忘”。为了解决这个问题，作者提出将原始模型中的知识“蒸馏”出来，并在更新模型的时候既对新类别进行学习，也对这部分蒸馏出来的知识进行学习，从而保证模型不会遗忘已有的知识。

具体来说，该方法的模型设计如上图所示。本文中，为了保证候选的 region proposal 不是针对原有模型中特定的类别，而是针对通用的物体，方法的基本架构基于 Fast RCNN。当更新模型的时候，需要两个版本的模型，其中上路的 Network A 为原始的模型（模型参数完全固定，不进行调整），下路的 Network B 为可以更新的模型。模型的整体流程如下：

以新类别的图像作为 Network A 的输入，从背景得分最低（即物体得分最高）的 128 个 RoI 中随机选取 64 个，并在 Network B 中计算这 64 个 RoI 的预测输出（包括分类预测的 logits 和 bounding box regression 输出），约束 Network B 的预测输出和相应的 Network A 的预测输出相同（使用 L2 损失进行约束，忽略 Network B 中对应新类别的输出项）。通过约束新模型在已有类别上的输出和旧模型在已有类别上的输出相同，保证旧类别的知识可以迁移到新模型上；
针对新增的类别，使用标准的 Fast RCNN 损失进行训练。

从实验结果来看，相比于在具有完整标注的全部数据上的模型训练的方式来说，增量式物体检测方法在性能上有一定的下降，但是相比于不考虑“灾难性遗忘”问题的方案有明显的提升。

活动推荐：

2023年9月3-5日，「QCon全球软件开发大会·北京站」将在北京•富力万丽酒店举办。此次大会以「启航·AIGC软件工程变革」为主题，策划了大前端融合提效、大模型应用落地、面向 AI 的存储、AIGC 浪潮下的研发效能提升、LLMOps、异构算力、微服务架构治理、业务安全技术、构建未来软件的编程语言、FinOps 等近30个精彩专题。咨询购票可联系票务经理 18514549229（微信同手机号）。

评论

发布

暂无评论

巧用Amazon PrivateLink——轻松访问私有终端节点Amazon S3

亚马逊云科技 (Amazon Web Services）

您有一份Microsoft Office 365技能宝典等待签收

Office 365 office办公软件

前端开发之动态管理Nginx集群的方法

nginx 前端开发

低代码实现探索（十三）字典.静态实体.系统变量

零道云-混合式低代码平台

🏆【Alibaba中间件技术系列】「RocketMQ技术专题」让我们一同来看看RocketMQ和Kafka索引设计

RocketMQ Alibaba Alibaba技术 1月月更

工具 | 如何对 MySQL 进行 TPC-C 测试？

全面拆解携程云原生实践，打造智能弹性的云端酒店直连系统！

亚马逊云科技 (Amazon Web Services）

强化云原生基础服务，焱融科技 YRCloudFile 与秒云完成产品兼容性互认证

云计算分布式云原生高性能文件存储

Karpenter : 新一代 Kubernetes auto scaling 工具

亚马逊云科技 (Amazon Web Services）

MySQL高级特性篇教程

从四种时序数据库选型中脱颖而出，TDengine在工控领域边缘侧的应用

数据库大数据 tdengine 物联网

APP性能分析工作台——你的最佳桌面端性能分析助手

字节跳动终端技术

字节跳动 APM Mars 应用性能监控产品

研读网络安全法律法规，提升技术管理者 “法” 商

百度搜索中台新一代内容架构：FaaS化和智能化实战

架构后端搜索 Faas

2021中国开源先锋33人榜单出炉：华为三位开源专家入选

使用 KubeSphere 管理 Amazon EKS Anywhere 集群

亚马逊云科技 (Amazon Web Services）

linux系统管理与自动化运维工具用哪款好？

Linux 运维 IT运维自动化运维

低代码实现探索（十四）工程化思想提高项目质量与可维护性

零道云-混合式低代码平台

大数据开发之离线分析工具Hive

服务探活的五种方式

微服务 dubbo 健康检查服务探活

开发者喜欢的“夜宵”是什么？揭秘开发者的独特“口味”

OceanBase 数据库

数据库开源新年 oceanbase 开发者大会

盘点 | 常用 PG 数据恢复方案概览【建议收藏】

数据库 postgresql RadonDB

关于dart中的late关键字，你了解多少？

flutter dart 1月月更

【网络安全】你必须知道的几个网络安全概念

运维网络安全防火墙 IT

【量化】量化交易入门系列6：量化交易学习书籍推荐（二）

恒生LIGHT云社区

量化策略量化投资量化交易量化

Linux云计算好学吗？Linux云计算运维学习资料 vim编辑器和恢复ext4下误删文件

Tech Talk 活动预告｜“公有云+5G” 时代下的开发难题，架构师大咖带你逐个击破！

亚马逊云科技 (Amazon Web Services）

近数据处理（NDP）——GaussDB(for MySQL)性能提升的秘密

华为云开发者联盟

MySQL 多线程 GaussDB(for MySQL) 近数据处理算子下推

霸屏综艺,牵手明星,扩列神器皮皮APP的出圈始末

大画 Spark :: 网络(2)-上篇-通过网络收取消息的过程

大数据 spark Spark 源码

风口上的“低代码”，是时候来系统学一学了！

博文视点Broadview

扫码添加小助手
领取最新资料包