写点什么

谷歌宣布 TensorFlow Object Detection API 支持 TensorFlow 2

  • 2020-07-29
  • 本文字数:1161 字

    阅读完需:约 4 分钟

谷歌宣布TensorFlow Object Detection API支持TensorFlow 2

谷歌宣布 TensorFlow Object Detection API(OD)支持 TensorFlow 2(TF2)。该版本包含与 eager 模式兼容的二进制文件、两个新的网络架构和针对所有受支持模型的预训练权重。


软件工程师 Vivek Rathod 和研究科学家 Jonathan Huang 在 TensorFlow 博客上对新版本的新特性做了概述。大部分工作是让现有的预训练模型与 TF2 兼容,对模型代码进行移植,使用了 Keras 层,并提供权重作为 TF2 检查点。OD 框架还支持同步分布式训练,以及用于训练、评估和导出的 eager 模式二进制文件。虽然所有的新模型和新的开发工作都只与 TF2 有关,但 TF1 仍然受支持。大多数代码模块都兼容 TensorFlow 的两个版本,不兼容的模块则分成两个版本。Rathod 和 Huang 写道:


我们的想法是让 TF2 和 Keras 的所有好处都暴露出来,同时继续为 TF1 的广大用户群提供支持。


TensorFlow Object Detection API 是“一个建立在 TensorFlow 之上的开源框架,让对象检测模型的构建、训练和部署变得更加容易”。这个框架包含了一组用于管理图像数据输入和对象检测模型接口的工具。一般来说,目标检测模型的输入是一个图像,然后输出一组方框,表示在图像中检测到的物体位置。OD API 还提供了预训练“模型动物园”,这对于开发自定义对象检测应用程序非常有用。“模型动物园”包含了几种流行的深度学习计算机视觉架构,如 MobileNetResNet,它们是基于 Common Objects in Context(COCO) 2017 数据集进行训练的。


TensorFlow 2 于 2019 年 9 月发布,采用 Keras 作为定义模型的官方高级 API。Keras 最初被设想为定义神经网络的接口,支持后端,包括 TensorFlow 和 Theano。TF2 还将 eager 执行设置为默认模式,让开发和调试变得更加容易。新的 OD API 利用了这些特性。预训练的模型使用 Keras 层重新实现,权重以 TF2 检查点格式进行保存。OD 框架中的辅助代码已经经过编译,开发人员可以通过交互式的方式来调试模型。新的 OD API 还支持同步分布式训练,可以加快大型模型的训练,同时不会降低准确性(相比异步分布式训练)。


除了移植现有模型,新版本还包含了两个新的模型架构: CenterNetEfficientDet。CenterNet 使用单点来表示对象位置,而不是方框,并具备“最佳的速度和精度权衡”(基于 COCO 数据集)。EfficientDet 是一个新的对象检测模型,比之前的 SOTA 模型体积小了 4 倍到 9 倍,使用更少的 FLOP(13 倍到 42 倍)。


一名 Reddit 用户评论道:


EfficientDet 看起来真的很有前途,它们致力于通过 TF2 让训练 OD 模型变得更容易。不过我觉得 TF 团队绝对可以投入一些资源来构建一个更简单的 Object Detection API,可以从 Torch Hub、Huggingface 甚至 Tensorflow Hub 获得灵感。


Object Detection API源代码和预训练模型可以在 GitHub 上找到。


原文链接


Google Announces TensorFlow 2 Support in Object Detection API


2020-07-29 11:341873

评论

发布
暂无评论
发现更多内容

2025年3月文章一览

codists

Python

AI思维导图生成器哪个好?5个导图软件大盘点!

职场工具箱

思维导图 办公软件 AI软件 AIGC 思维导图软件

Mac电脑必备文件管理器推荐,MacBook文件资源管理软件哪家强?

阿拉灯神丁

MacBook CleanMyMac Mac软件 文件管理软件 Path Finder

CAD中绘制带宽度属性的多段线方法

极客天地

国产化替代是个伪命题?被误解多年的开源软件,如今怎么样了

禅道项目管理

信创 企业安全 开源软件 项目管理软件 国产化替代

ShareSDK全面适配鸿蒙NEXT

MobTech袤博科技

sharesdk mobtech 鸿蒙 os

什么是DNS劫持?DNS劫持如何预防和应对?(国科云)

防火墙后吃泡面

非凸科技走进北大汇丰,揭秘数智交易前沿技术与人才密码

非凸科技

OASA 厂商三未信安完成与 Anolis OS 及其衍生版适配,密码卡性能与稳定性获验证

OpenAnolis小助手

操作系统 龙蜥社区 龙蜥生态

SysOM AI 可观测体系:零侵入、低开销,让系统透明化

OpenAnolis小助手

AI 运维 操作系统 龙蜥社区 AI可观测

携手龙蜥,Alinux 最佳 AI 镜像服务商公布,堡塔、飞致云等 6 家企业实力登榜

OpenAnolis小助手

AI 操作系统 龙蜥社区 Alibaba Cloud Linux

SpringAI用嵌入模型操作向量数据库!

伤感汤姆布利柏

推荐 5 个 火火火火 的CMS开源.Net项目

不在线第一只蜗牛

.net 开源

探讨React Native与小程序结合的技术架构

xuyinyin

BSO收购InterCloud,强化高性能云连接解决方案

财见

数字货币交易所开发中的常见问题与解决方案

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

CAD中对象的等分操作方法

极客天地

智能设备操作系统闭源化浪潮下,小程序生态重构与技术创新

FinFish

操作系统 小程序容器 小程序技术 闭源操作系统

快节奏业务增长,还是得App混合开发

FinFish

APP开发 混合开发 小程序技术 小程序容器技术

1688代采系统到底牛在哪?揭秘核心功能和技术硬骨头

代码忍者

通义灵码助力技术求职:如何成为笔试面试冲刺的“超级助手”

阿里云云效

阿里云 云原生

天润云2024财报:AI收入增长72.5%,营收毛利再创新高!

天润融通

MobPush标签推送新范式,精准触达就这么玩

MobTech袤博科技

消息推送 mobpush

SpringAI用嵌入模型操作向量数据库!

王磊

2025年局域网聊天软件推荐,打造高效便捷的局域网沟通利器

BeeWorks

即时通讯 私有化部署 IM即时通讯 局域网视频软件

如何编写更好的单元测试

俞凡

最佳实践 软件测试

SITA收购CCM,通过将旅游技术与高端设计相结合

财见

新闻速递丨Altair与JetZero达成战略合作,共拓翼身融合飞机技术新纪元

Altair RapidMiner

仿真 hyperworks 航空航天 CFD FlightStream

通义灵码助力技术求职:如何成为笔试面试冲刺的“超级助手”

阿里巴巴云原生

阿里云 云原生

布鲁可第3届BFC创作赛第2季度「破茧赛季」正式启幕,赛事体系迎来新升级

财见

谷歌宣布TensorFlow Object Detection API支持TensorFlow 2_大数据_Anthony Alford_InfoQ精选文章