写点什么

谷歌宣布 TensorFlow Object Detection API 支持 TensorFlow 2

  • 2020-07-29
  • 本文字数:1161 字

    阅读完需:约 4 分钟

谷歌宣布TensorFlow Object Detection API支持TensorFlow 2

谷歌宣布 TensorFlow Object Detection API(OD)支持 TensorFlow 2(TF2)。该版本包含与 eager 模式兼容的二进制文件、两个新的网络架构和针对所有受支持模型的预训练权重。


软件工程师 Vivek Rathod 和研究科学家 Jonathan Huang 在 TensorFlow 博客上对新版本的新特性做了概述。大部分工作是让现有的预训练模型与 TF2 兼容,对模型代码进行移植,使用了 Keras 层,并提供权重作为 TF2 检查点。OD 框架还支持同步分布式训练,以及用于训练、评估和导出的 eager 模式二进制文件。虽然所有的新模型和新的开发工作都只与 TF2 有关,但 TF1 仍然受支持。大多数代码模块都兼容 TensorFlow 的两个版本,不兼容的模块则分成两个版本。Rathod 和 Huang 写道:


我们的想法是让 TF2 和 Keras 的所有好处都暴露出来,同时继续为 TF1 的广大用户群提供支持。


TensorFlow Object Detection API 是“一个建立在 TensorFlow 之上的开源框架,让对象检测模型的构建、训练和部署变得更加容易”。这个框架包含了一组用于管理图像数据输入和对象检测模型接口的工具。一般来说,目标检测模型的输入是一个图像,然后输出一组方框,表示在图像中检测到的物体位置。OD API 还提供了预训练“模型动物园”,这对于开发自定义对象检测应用程序非常有用。“模型动物园”包含了几种流行的深度学习计算机视觉架构,如 MobileNetResNet,它们是基于 Common Objects in Context(COCO) 2017 数据集进行训练的。


TensorFlow 2 于 2019 年 9 月发布,采用 Keras 作为定义模型的官方高级 API。Keras 最初被设想为定义神经网络的接口,支持后端,包括 TensorFlow 和 Theano。TF2 还将 eager 执行设置为默认模式,让开发和调试变得更加容易。新的 OD API 利用了这些特性。预训练的模型使用 Keras 层重新实现,权重以 TF2 检查点格式进行保存。OD 框架中的辅助代码已经经过编译,开发人员可以通过交互式的方式来调试模型。新的 OD API 还支持同步分布式训练,可以加快大型模型的训练,同时不会降低准确性(相比异步分布式训练)。


除了移植现有模型,新版本还包含了两个新的模型架构: CenterNetEfficientDet。CenterNet 使用单点来表示对象位置,而不是方框,并具备“最佳的速度和精度权衡”(基于 COCO 数据集)。EfficientDet 是一个新的对象检测模型,比之前的 SOTA 模型体积小了 4 倍到 9 倍,使用更少的 FLOP(13 倍到 42 倍)。


一名 Reddit 用户评论道:


EfficientDet 看起来真的很有前途,它们致力于通过 TF2 让训练 OD 模型变得更容易。不过我觉得 TF 团队绝对可以投入一些资源来构建一个更简单的 Object Detection API,可以从 Torch Hub、Huggingface 甚至 Tensorflow Hub 获得灵感。


Object Detection API源代码和预训练模型可以在 GitHub 上找到。


原文链接


Google Announces TensorFlow 2 Support in Object Detection API


2020-07-29 11:341801

评论

发布
暂无评论
发现更多内容

为什么重写equals一定也要重写hashCode方法?

电子尖叫食人鱼

Java

腾讯元宝再更新!上线“对话分组”,支持自定义回答风格

极客天地

数字中国 | 史宾格荣获 “2025数字中国创新大赛”银奖

百度安全

Timefold 仓库拣货优化案例导读

PeterOne

人工智能 算法 运筹规划

零信任的用户行为分析: 通过综合策略解锁安全洞察力(一)

天翼云开发者社区

安全 零信任策略

中烟创新入选“2024卓越软件项目优秀案例”

中烟创新

想提升SEO爬虫效率?一套完整SERP抓取解决方案给你!

kookeey代理严选

动态代理 SEO工具 关键词搜索 SEO 优化

区块链RWA系统的运营

北京木奇移动技术有限公司

区块链技术 软件外包公司 RWA系统开发

SpringBoot3整合SpringSecurity6(三)基于数据库的用户认证

电子尖叫食人鱼

oracle Spring Boot

玩转MCP | 一文看懂如何在 Trae IDE 中解锁 MCP

TRAE

人工智能 开发者 #编程 MCP Trae

《算法导论(第4版)》阅读笔记:p9-p9

codists

算法

斯曼森携手亚马逊云科技,使用 Amazon Nova 打造中文法律大模型

亚马逊云科技 (Amazon Web Services)

从表格到系统:Classmethod 用 NocoBase 构建员工信息管理系统

NocoBase

开源 低代码 表格 管理工具 员工信息管理

内网im软件,支持企业云盘的协同办公软件推荐

BeeWorks

即时通讯 IM 私有化部署

黑龙江等保测评最新消息如下

黑龙江陆陆信息测评部

天翼云息壤全面升级!

天翼云开发者社区

算力 智能云 息壤

通义发布小尺寸多模态模型 Qwen2.5-Omni-3B;英伟达开源 ASR 模型 Parakeet TDT 0.6B 丨日报

声网

台达支持经济学人集团Economist Impact发布全球可持续AI报告

财见

HarmonyOS运动开发:如何集成百度地图SDK、运动跟随与运动公里数记录

王二蛋和他的张大花

鸿蒙

深圳金融科技交流会,探讨AI大模型重塑资管新生态

非凸科技

Cyber Triage 3.14 发布,带来全新用户界面、Hayabusa 集成、基线设定等功能

sysin

数字取证

企业内部IM即时通讯软件,如何解决公司安全办公问题?

BeeWorks

即时通讯IM 私有化部署 企业级应用

AI 调教指南!一文教会你如何在 Trae IDE 中配置自定义规则

TRAE

人工智能 编程 开发者 MCP Trae

彻底搞懂 MCP 是什么、和 API 的区别、对企业的价值,如何在企业落地、未来趋势丨社区来稿

声网

PPT美化AI哪个好?2个AI美化PPT软件盘点!

职场工具箱

效率 职场 PPT 办公软件 AI生成PPT

副业搞钱新风口!靠 AI 写代码,程序员创收轻松破万

飞算JavaAI开发助手

Studio 3T 2025.8 发布 - MongoDB 的终极 GUI、IDE 和 客户端

sysin

mongodb

Excel百万数据高性能导出方案!

量贩潮汐·WholesaleTide

Excel

Arthas mc(Memory Compiler/内存编译器 )

刘大猫

人工智能 监控 Arthas 监控工具 mc

区块链RWA系统的上线

北京木奇移动技术有限公司

区块链技术 软件外包公司 RWA开发

Q1收入猛增46%,AI出海致富的秘密,藏在昆仑万维财报里

脑极体

AI

谷歌宣布TensorFlow Object Detection API支持TensorFlow 2_大数据_Anthony Alford_InfoQ精选文章