2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

TensorFlow 学会黄瓜选择和分类

  • 2016-09-11
  • 本文字数:972 字

    阅读完需:约 3 分钟

Makoto Koike 对 TensorFlow 如何学会了他这个黄瓜种植户的黄瓜选择和分类原则进行了详细描述。这个话题在 Hacker News 上被斥为谷歌的市场营销,而在其他地方则被当成是深度学习、神经网络和机器学习日益流行的案例。TensorFlow 的学习结果大大超出了预期。选择和分类通常是一个非常耗时的过程,在收获的高峰季节,临时员工都无法在短期内学会,这经常导致Koike 一家根据若干属性花费大量的时间对黄瓜进行仔细的整理和分类。

Koike 使用了由其家庭成员耗时三个月分类完成的 7000 张黄瓜图片作为训练数据集。在对该神经网络进行测试时,他通过 Raspberry Pi 控制图像数据的获取,供经过训练的神经网络处理。在实验组(其中的图像数据不包含在训练集中)上,该网络的成功率达到了 70% 到 90%。 CUCUMBER-9 库提供了训练数据集。据报道,TensorFlow python api 的代码实现是由 TensorFlow Deep MNIST for Experts 提供的示例代码修改而来。这篇文章没有具体说明 Koike 训练模型时使用的计算概要文件,也没有实际演示经过训练的网络。对于该模型的效率和准确率,Koike 表示:

在我对测试图片进行验证时,识别准确率超过了 95%。但如果把这个系统应用在真实的场景中,准确率降低到大约 70%。我怀疑神经网络模型因为训练图片数量不足产生了“过拟合”问题(这是神经网络中的一个现象,经过训练的模型只适合小规模的训练集)。

分类问题符合良好深度学习对象的一般模式;图像属于“我看到它就知道它”的类别,或者是直觉和经验驱动的分类,那通常很难使用语言简单地描述出来,需要丰富的经验才能做好。Koike 详细阐述了这个话题,他指出:

分类工作不是一项容易学习的任务。你不只要考虑大小和粗细,还要考虑颜色、纹理、小划痕,是直是弯,是否多刺。这需要花费几个月的时间来学习,你不能只在最忙的时候雇用兼职人员。我自己都是最近才学会如何把黄瓜整理好。

对于当前的原型,扩展性和计算时间是 Koike 面临的一项挑战,即使将图片转换成低分辨率(80x80)的图片,该训练模型仍然需要两到三天的时间处理那个包含 7000 张图片的训练数据集。虽然 Koike 表示感兴趣,但他还没有在 Google Cloud ML 上执行训练。那是谷歌推出的一个用于分布式 TensorFlow 训练的大规模集群。他还指出,他尚未对不同参数、配置和算法的组合进行测试。

查看英文原文: TensorFlow Learns Cucumber Selection and Classification

2016-09-11 19:004963
用户头像

发布了 1008 篇内容, 共 442.9 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

高质量的缺陷分析:让自己少写 bug

阿里技术

技术管理 技术人生 内容合集

热门招聘丨 XTransfer史上最全产品技术岗位公开招聘

XTransfer技术

产品 技术 招聘 XTransfer

【浅谈黑客与学习思路】黑客的种类和行为,初学者应该怎样学习

H

黑客 网络安全 信息安全

技术三板斧:关于技术规划、管理、架构的思考

阿里技术

技术管理 技术人生 内容合集

计算机网络体系结构

淡泊明志、宁静致远

TCP 网络结构

一种播放远程TS格式媒体文件的新方案

Changing Lin

12月日更

三年磨一剑,高德体验优化总结

阿里巴巴终端技术

ios android 性能优化 移动开发 客户端

揭开神秘面纱,如何组织一次分布式压测

博睿数据

【12月日更】浅谈Golang两种线程安全的map

小梁编程汇

golang 缓存 高性能 并发 多线程安全

PMI 的野望

Franklin 许峰

DevOps 敏捷 Lean 规范敏捷 PMI

安装TortoiseGit教程 手把手教学

Z.

git 工具 安装 Tortoisegit

王者荣耀商城异地多活架构设计

张靖

#架构实战营

第七模块总结

张靖

#架构实战营

2021年SASE融合战略路线图(一)

devpoint

SD-WAN sase 12月日更

联想企业科技集团与京东耀弘签订战略合作协议 实现合作发展新跨越

科技大数据

国家质量基础设施(NQI)一站式服务平台,NQI云服务平台建设

a13823115807

质量基础设施一站式服务 一站式服务平台开发

百度API接口智能化测试探索与实践

百度开发者中心

自动化测试 API测试 智能化测试

多行内容超出...显示的终极解决方案

CRMEB

如何优雅的关闭 Java 线程池

淡泊明志、宁静致远

线程池

恒源云(GPUSHARE)_文本数据扩增时,哪些单词 (不) 应该被选择?

恒源云

深度学习 语音识别 语义

Flutter 高性能、多功能的全场景滚动容器原理与实践

阿里巴巴终端技术

flutter 移动开发 客户端

关于写文章的一点经验

阿里技术

技术管理 技术人生 内容合集

让“美”势不可挡,DataPipeline助力全球知名化妆品企业数字化营销再提速

DataPipeline数见科技

大数据 中间件 数据融合 数据迁移 数据管理

Flutter 应用程序中使用 GridTile 小部件

坚果

28天写作 12月日更

技术人如何自我成长?

阿里技术

技术管理 技术人生 内容合集

如何写好代码?

阿里技术

技术管理 技术人生 内容合集

EMQ X 企业版 v4.4.0 发布:新增三项集成支持、增强异常诊断能力

EMQ映云科技

云原生 物联网 IoT mqtt 规则引擎

阿里技术 技术人成长| 内容合集

阿里技术

技术管理 技术人生 技术专题合集

Python爬虫实战,pymysql模块,Python实现抓取音乐评论

Java全栈架构师

Python MySQL 数据库 程序员 面试

架构实战 - 模块七

唐敏

架构实战营

TensorFlow学会黄瓜选择和分类_AI&大模型_Dylan Raithel_InfoQ精选文章