写点什么

Google 使用 3 亿张图片大幅度改进图像识别算法

  • 2017-08-03
  • 本文字数:671 字

    阅读完需:约 2 分钟

Google 和 CMU 的研究员使用 3 亿张图片,在图像识别算法的几个指标上取得了长足改进,而往常的训练一般只使用一百万张图片。

很多开发者在训练物体检测算法时会使用包含一百万张图片的 ImageNet 数据集。这个数据集从 2011 年起就没有新图片加入了。然而,在该数据集上训练的神经网络中的参数数量与日俱增,训练模型的 GPU 算力也在增加。卡内基梅隆大学(CMU)中 Google 的研究人员和科学家提出:如果增加训练数据量会如何?

于是,Google 建立了一个内部数据集,含有3 亿张图片,标记为18291 个类别。图片标注的来源包括原始网络信号,网页之间的联系,以及用户的反馈。因为不是由人标注的,所以含有20% 的噪音。

结论是:增大数据量果然有益。虽然图片标记含有噪音,算法的准确率还是提高了3 个百分点。很明显,数据量的增加克服了标记的噪音。研究人员发现算法的表现和数据量呈对数关系上升,如图所示。论文作者认为,现有的模型是基于一百万张图片建立的:如果对模型进行调整,准确率还有上升空间。

研究人员在微软的 COCO 对象检测基准测试上进行了测试,结果喜人:平均正确率 (AP) 从 34.3 上升到 37.4。Google 和 CMU 在 ICCV 会议上发布了算法和评测,并发布了论文《重新审视深度学习时代数据的非理性效果》,可在arxiv 自由获取。

查看英文原文 Researchers Improve State of the Art in Image Recognition Using Data Set With 300 Million Images


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-08-03 19:003758

评论

发布
暂无评论
发现更多内容

互联网新的宝藏地,藏在鸿蒙生态里

最新动态

WAAP,提供Web应用程序与API的全面保护

德迅云安全杨德俊

socks5全局代理客户端:Proxifier for Mac 注册版

你的猪会飞吗

Mac软件下载站 mac破解软件下载

2024-06-22:用go语言,给定一个起始下标为 0 的长度为3的整数数组 nums,根据这些数字构建三角形。 如果无法构成三角形,则返回 “none“; 否则根据三角形的边长关系返回对应类型的字

福大大架构师每日一题

福大大架构师每日一题

AI+阅读,华为阅读带来鸿蒙生态下的新体验新能力

最新动态

Visio绘图文件阅读器:VSD Viewer for Mac 激活版

你的猪会飞吗

mac软件下载 VSD Viewe下载

万象革新,开启鸿蒙原生应用生态新篇章

最新动态

加速鸿蒙生态共建,蚂蚁mPaaS助力鸿蒙原生应用开发创新

HarmonyOS SDK

华为 HarmonyOS

鸿蒙生态伙伴SDK市场正式发布,驱动千行百业鸿蒙原生应用开发

HarmonyOS SDK

华为 HarmonyOS

华为云618营销季Web及移动App上云体验,助力软件行业创新发展

YG科技

直击HDC2024开发者主题演讲 HarmonyOS NEXT开发者解决方案全面升级

最新动态

HarmonyOS NEXT应用市场焕新:新体验,开启新增长

最新动态

【HDC 2024】华为云开发者联盟驱动应用创新,赋能开发者成长

华为云开发者联盟

华为云 华为云开发者联盟 HDC2024 华为开发者大会2024 企业号2024年6月PK榜

GitHub标星破千!这份Python并行编程手册,可以封神了!

我再BUG界嘎嘎乱杀

Python 编程 后端 开发语言 并行编程

华为阅读携手多家头部出版机构,共创数字阅读新纪元

最新动态

Google使用3亿张图片大幅度改进图像识别算法_Google_Roland Meertens_InfoQ精选文章