写点什么

谷歌用于图像识别的机器学习模型已移植至 TensorFlow 并已开源

  • 2016-11-03
  • 本文字数:964 字

    阅读完需:约 3 分钟

随着 announcement 宣布将用于图像识别的 TensorFlow 模型,以及对新老方法的精确度和性能进行比较评测的测试方法开源,谷歌 Google 在过去几年中迈上了一段全新的旅程。2014 年的 Inception V1 ,2015 年的 Inception V2 ,以及最新发布的 Inception V3 模型逐渐完善,分别以 89.6%、91.8%,以及 93.9% 准确度的成绩位居 ImageNet 2012 图像分类测试的前五名。在使用 BLEU -4 指标衡量机器生成的注解的测试中,通过将一种自然语言的语句翻译成另一种语言并对准确度进行比较,基于TensorFlow 的方法相比原本最先进的 DistBelief 模型也取得了领先两分的成绩。

在从原有实现中移植模型,并对其进行完善的过程中,最重要的问题之一在于对图像中的对象进行分类,以及对对象进行描述并将一张图像中的对象与另一张图像中的对象进行关联。为了解决这一问题,该模型在分类操作之外增加了一个微调操作,可以让模型提取用于描述对象细节的有用信息。通过将图像分类操作拆分为多个步骤,首先识别其他操作中确定的对象,并增加形容和预处理操作,并为要处理的注解提供必要的结构,使其在语句结构上更为准确,更类人。

该模型有一个范例:识别铁轨上的火车图像,随后识别火车为黄色夹杂着蓝色。最终合成的结果识别为:黄蓝相间的火车正行驶在铁轨上。虽然在本例中模型能否确定静态图片中对象是运动中的或静止的并不重要,但所输入图像的注解在训练数据中将类似图像中的对象描述为运动中的或静止的,这很重要。

该模型可将之前学习到的图像注解中的不同元素组合在一起,针对更多图像创建全新的注解,新的图像中可以包含多个已分类对象,但所有对象并未包含在同一个训练数据集中。在这个范例中,该模型自行创建出一个之前并不存在的注解。

在对原有模型的实现与新的模型进行性能评测对比发现,在通过Nvidia K20 GPU 运行DistBelief 以及全新的基于TensorFlow 的Inception V3 进行的性能对比中,TensorFlow 的训练时间(0.7 秒)仅为DistBelief(3.0 秒)的25%。除了基于TensorFlow 的Inception V3 图像分类模型,谷歌还提到了即将发布 Inception-ResNet-v2 模型,但并未谈到有关该模型的性能评测信息。虽然未使用训练数据集,但他们会通过人工生成的图像注解作为最基础的训练数。

查看 **** 英文原文 Google Machine Learning Models for Image Captioning Ported to TensorFlow and Open-Sourced

2016-11-03 19:005869
用户头像

发布了 283 篇内容, 共 121.3 次阅读, 收获喜欢 63 次。

关注

评论

发布
暂无评论
发现更多内容

打破固有思维(十四)

Changing Lin

5分钟速读之Rust权威指南(六)

wzx

rust

医疗数字化:区块链或成最强辅助

CECBC

医疗

一款开源小工具,提升K8S资源管理幸福感!

Rancher

2021年4月券商App行情刷新及交易体验评测报告

博睿数据

发布两小时,Github访问量破百万,阿里内部首次公布的 Java10W 字面经有多强?

Java 程序员 架构 面试

架构训练营模块 4 作业 - 江哲

江哲

亚马逊云科技宣布在上海设立生命健康行业数字化赋能中心

亚马逊云科技 (Amazon Web Services)

指挥中心可视化研判分析系统搭建解决方案

HarmonyOS 的分布式技术,让小朋友爱上涂鸦

科技汇

博睿数据多点开花,数据链DNA加速走进金融、医疗、政企行业

博睿数据

数据链DNA

从外包跳槽到大厂,我用了55天成功逆袭。

Java 程序员 架构 面试

ArrayList vs LinkedList

ltc

ArrayList linkedlist

4月热搜:揭秘金融级人脸实名认证解决方案背后的技术硬货

百度大脑

百度

hive交互的几种方式

五分钟学大数据

大数据 hive 5月日更

比特币披萨节由来:11年前BTC首次在现实世界使用

meio

比特币

数字货币与加密货币、虚拟货币的区别

meio

比特币 数字货币 加密货币 虚拟货币

Flink的广播变量

大数据技术指南

大数据 flink 5月日更

指挥中心可视化研判分析系统搭建解决方案

NetCore配置文件使用全过程

happlyfox

520单身福利

区块链技术在数字农业领域的应用挑战

CECBC

夺魁!亚马逊云科技荣膺中国数据管理解决方案领导者!

亚马逊云科技 (Amazon Web Services)

Flutter 混合开发基础

网易云信

flutter

一款优秀数据库中间件的不完全解析

Coder的技术之路

源码阅读 源码刨析 数据库中间件

IPFS与 Filecoin的区别是什么?

meio

IPFS Filecoin

【签约计划】试用期规则

InfoQ写作社区官方

签约计划 热门活动

全面隔绝虚拟货币暴涨暴跌风险

CECBC

BOE(京东方)亮相世界智能大会 创新科技强势发力智慧物联新赛道

DT极客

并发王者课 - 青铜 2:峡谷笔记 - 简单认识Java中的线程

MetaThoughts

Java 后端 多线程 并发 王者并发课

SWOT分析模型

石云升

创业 战略 职场经验 5月日更

API网关才是大势所趋?SpringCloud Gateway保姆级入门教程

Zhendong

Java spring API 网关

谷歌用于图像识别的机器学习模型已移植至TensorFlow并已开源_AI&大模型_Dylan Raithel_InfoQ精选文章