在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

谷歌用于图像识别的机器学习模型已移植至 TensorFlow 并已开源

  • 2016-11-03
  • 本文字数:964 字

    阅读完需:约 3 分钟

随着 announcement 宣布将用于图像识别的 TensorFlow 模型,以及对新老方法的精确度和性能进行比较评测的测试方法开源,谷歌 Google 在过去几年中迈上了一段全新的旅程。2014 年的 Inception V1 ,2015 年的 Inception V2 ,以及最新发布的 Inception V3 模型逐渐完善,分别以 89.6%、91.8%,以及 93.9% 准确度的成绩位居 ImageNet 2012 图像分类测试的前五名。在使用 BLEU -4 指标衡量机器生成的注解的测试中,通过将一种自然语言的语句翻译成另一种语言并对准确度进行比较,基于TensorFlow 的方法相比原本最先进的 DistBelief 模型也取得了领先两分的成绩。

在从原有实现中移植模型,并对其进行完善的过程中,最重要的问题之一在于对图像中的对象进行分类,以及对对象进行描述并将一张图像中的对象与另一张图像中的对象进行关联。为了解决这一问题,该模型在分类操作之外增加了一个微调操作,可以让模型提取用于描述对象细节的有用信息。通过将图像分类操作拆分为多个步骤,首先识别其他操作中确定的对象,并增加形容和预处理操作,并为要处理的注解提供必要的结构,使其在语句结构上更为准确,更类人。

该模型有一个范例:识别铁轨上的火车图像,随后识别火车为黄色夹杂着蓝色。最终合成的结果识别为:黄蓝相间的火车正行驶在铁轨上。虽然在本例中模型能否确定静态图片中对象是运动中的或静止的并不重要,但所输入图像的注解在训练数据中将类似图像中的对象描述为运动中的或静止的,这很重要。

该模型可将之前学习到的图像注解中的不同元素组合在一起,针对更多图像创建全新的注解,新的图像中可以包含多个已分类对象,但所有对象并未包含在同一个训练数据集中。在这个范例中,该模型自行创建出一个之前并不存在的注解。

在对原有模型的实现与新的模型进行性能评测对比发现,在通过Nvidia K20 GPU 运行DistBelief 以及全新的基于TensorFlow 的Inception V3 进行的性能对比中,TensorFlow 的训练时间(0.7 秒)仅为DistBelief(3.0 秒)的25%。除了基于TensorFlow 的Inception V3 图像分类模型,谷歌还提到了即将发布 Inception-ResNet-v2 模型,但并未谈到有关该模型的性能评测信息。虽然未使用训练数据集,但他们会通过人工生成的图像注解作为最基础的训练数。

查看 **** 英文原文 Google Machine Learning Models for Image Captioning Ported to TensorFlow and Open-Sourced

2016-11-03 19:005994
用户头像

发布了 283 篇内容, 共 124.7 次阅读, 收获喜欢 63 次。

关注

评论

发布
暂无评论
发现更多内容

字节跳动 MapReduce - Spark 平滑迁移实践

字节跳动云原生计算

大数据 spark 云原生

平凯数据库亮相 2023 信息技术应用创新论坛

PingCAP

数据库 信息化 TiDB

【论文解读】模型即服务-介绍MaaS中所涉及的关键技术

合合技术团队

人工智能 大数据 合合信息 论文解读

cannot load "mso.dll" vs2008 web开发问题

GoodTime

web开发 VS2008

市场上常见的5种LED异形屏

Dylan

设计 场景 LED LED显示屏

什么是仿真软件?推荐几个简单易上手的几款CAE软件!

智造软件

CAE 仿真软件 仿真技术 CAE软件

独立站新手教程引流篇:YouTube SEO优化指南!

九凌网络

天猫店铺所有商品数据接口(Tmall.item_search_shop)

tbapi

天猫API接口 天猫商品数据接口 天猫店铺所有商品数据接口 天猫店铺商品接口

软件测试/测试开发丨Python面向对象 学习笔记

测试人

Python 软件测试 测试开发

码住!8个小众宝藏的开发者学习类网站

伤感汤姆布利柏

学习 效率 低代码 低代码开发工具

python3中,//、/ 的区别

GoodTime

Python 水仙花数 // /

支付宝 v3 验签如何实现

盐焗代码虾

Java 支付宝 验签

外贸网站显示不安全警告怎么办?消除网站不安全警告超全指南

九凌网络

TiDB 入选 2023 年中国云原生数据库十大厂商推荐

PingCAP

数据库 云原生 TiDB 金融业

什么是意向锁?它和意向书有什么区别?

王磊

Java 面试

荣耀Magic6系列旗舰新品及MagicOS 8.0发布会

荣耀开发者服务平台

安全 UX 交互 人机协作 loT

怎么在GridView中限制显示字数

GoodTime

C# asp.net GridView

爬虫业务中,为什么使用高匿代理ip仍然会被识别出来呢?

巨量HTTP

数据采集 代理IP http代理

【直播预告】刘军博士:科学研究中的AI计算:何助力团队协作创新

九章云极DataCanvas

AIBP,我的下一个职业规划

法老猫

AIGC LLMs AIBP

干货满满!学习有限元分析软件Abaqus的几个必备理论

思茂信息

abaqus abaqus软件 abaqus有限元仿真 有限元分析

云原生应用开发模式的一个构想

Jade@pluto-lang

Serverless Faas 云原生(Cloud Native) aws lambda Pluto

谷歌用于图像识别的机器学习模型已移植至TensorFlow并已开源_AI&大模型_Dylan Raithel_InfoQ精选文章