【AICon】探索八个行业创新案例,教你在教育、金融、医疗、法律等领域实践大模型技术! >>> 了解详情
写点什么

TensorFlow 学会黄瓜选择和分类

  • 2016-09-11
  • 本文字数:972 字

    阅读完需:约 3 分钟

Makoto Koike 对 TensorFlow 如何学会了他这个黄瓜种植户的黄瓜选择和分类原则进行了详细描述。这个话题在 Hacker News 上被斥为谷歌的市场营销,而在其他地方则被当成是深度学习、神经网络和机器学习日益流行的案例。TensorFlow 的学习结果大大超出了预期。选择和分类通常是一个非常耗时的过程,在收获的高峰季节,临时员工都无法在短期内学会,这经常导致Koike 一家根据若干属性花费大量的时间对黄瓜进行仔细的整理和分类。

Koike 使用了由其家庭成员耗时三个月分类完成的 7000 张黄瓜图片作为训练数据集。在对该神经网络进行测试时,他通过 Raspberry Pi 控制图像数据的获取,供经过训练的神经网络处理。在实验组(其中的图像数据不包含在训练集中)上,该网络的成功率达到了 70% 到 90%。 CUCUMBER-9 库提供了训练数据集。据报道,TensorFlow python api 的代码实现是由 TensorFlow Deep MNIST for Experts 提供的示例代码修改而来。这篇文章没有具体说明 Koike 训练模型时使用的计算概要文件,也没有实际演示经过训练的网络。对于该模型的效率和准确率,Koike 表示:

在我对测试图片进行验证时,识别准确率超过了 95%。但如果把这个系统应用在真实的场景中,准确率降低到大约 70%。我怀疑神经网络模型因为训练图片数量不足产生了“过拟合”问题(这是神经网络中的一个现象,经过训练的模型只适合小规模的训练集)。

分类问题符合良好深度学习对象的一般模式;图像属于“我看到它就知道它”的类别,或者是直觉和经验驱动的分类,那通常很难使用语言简单地描述出来,需要丰富的经验才能做好。Koike 详细阐述了这个话题,他指出:

分类工作不是一项容易学习的任务。你不只要考虑大小和粗细,还要考虑颜色、纹理、小划痕,是直是弯,是否多刺。这需要花费几个月的时间来学习,你不能只在最忙的时候雇用兼职人员。我自己都是最近才学会如何把黄瓜整理好。

对于当前的原型,扩展性和计算时间是 Koike 面临的一项挑战,即使将图片转换成低分辨率(80x80)的图片,该训练模型仍然需要两到三天的时间处理那个包含 7000 张图片的训练数据集。虽然 Koike 表示感兴趣,但他还没有在 Google Cloud ML 上执行训练。那是谷歌推出的一个用于分布式 TensorFlow 训练的大规模集群。他还指出,他尚未对不同参数、配置和算法的组合进行测试。

查看英文原文: TensorFlow Learns Cucumber Selection and Classification

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2016-09-11 19:004353
用户头像

发布了 1008 篇内容, 共 374.3 次阅读, 收获喜欢 341 次。

关注

评论

发布
暂无评论
发现更多内容

JVM g1 gc学习笔记一

风翱

GC 9月日更

一文教你全方位揭秘Ajax指南

孙叫兽

ajax 大前端 引航计划

微信朋友圈 - 服务高性能复杂度分析

黑鹰

Opus从入门到精通(五)OggOpus封装器全解析

轻口味

音视频 9月日更

架构实战营模块9作业

zlz

百度飞桨发布开源生态最新成果:汇聚370万开发者

百度大脑

人工智能

看动画学算法之:doublyLinkedList

程序那些事

数据结构 算法 看动画学算法 程序那些事

架构实战营-模块四-千万级学生管理系统考试试卷存储方案

娜酱

#架构实战营

WebRTC 的本地视频预览播放器

liuzhen007

音视频 引航计划 领航计划

监控系统使用对比 -- 你怎么看当前的主流监控系统

耳东@Erdong

关系型数据库 Prometheus 时序数据库 zabbix 9月日更

Centos7升级Python2到Python3

入门小站

Linux

用 Go 写的轻量级 OpenLdap 弱密码检测工具

Marionxue

Docker Docker-compose 弱密码 openldap Go 语言

探究数字内容生产商机,把握未来内容生产脉搏

华为云开发者联盟

媒体 视频 华为云 数字内容 影视

走进吉利|EMQ 映云科技助力车企“新四化”

EMQ映云科技

车联网 物联网 IoT emq iov

001云原生之概念

穿过生命散发芬芳

云原生 9月日更

「Python数据分析系列」1. 数据科学基本介绍

数据与智能

Python 人工智能 数据分析

WebRTC如何在网页端添加硬水印

liuzhen007

音视频 引航计划 领航计划

Dom4j 如何输出 Document 中的内容到文本

HoneyMoose

谈 C++17 里的 State 模式之一

hedzr

算法 设计模式 Design Patterns c++17 有限状态机

一文深度挖掘AI的图像分类能力!

cv君

AI 引航计划

不吹不黑一份代码即可进Kaggle排行榜!

cv君

AI 引航计划

让数据“活”起来 腾讯位置服务数据可视化JS API持续升级

一文讲清楚FusionInsight MRS CDL如何使用

华为云开发者联盟

大数据 数据湖 FusionInsight MRS 集成 CDL

在线GIF图片帧拆分工具

入门小站

工具

百度联手清华大学出版社 打造国内首套产教融合人工智能系列教材

百度大脑

湖南交通学院校友联谊圈小程序设计方案

CC同学

Java 面试八股文之基础篇(一)

Dobbykim

Coffee架构实战 005 千万级学生管理系统的试卷存储方案

咖啡

读《第一次把事情做对》有感

孙叫兽

工作 引航计划 第一次 做对

Go 新人学习资料汇总(持续更新)

baiyutang

golang 9月日更

宇宙最强语言PHP的“全栈”框架——Laravel来了!

博文视点Broadview

TensorFlow学会黄瓜选择和分类_AI&大模型_Dylan Raithel_InfoQ精选文章