写点什么

Google 使用 3 亿张图片大幅度改进图像识别算法

  • 2017-08-03
  • 本文字数:671 字

    阅读完需:约 2 分钟

Google 和 CMU 的研究员使用 3 亿张图片,在图像识别算法的几个指标上取得了长足改进,而往常的训练一般只使用一百万张图片。

很多开发者在训练物体检测算法时会使用包含一百万张图片的 ImageNet 数据集。这个数据集从 2011 年起就没有新图片加入了。然而,在该数据集上训练的神经网络中的参数数量与日俱增,训练模型的 GPU 算力也在增加。卡内基梅隆大学(CMU)中 Google 的研究人员和科学家提出:如果增加训练数据量会如何?

于是,Google 建立了一个内部数据集,含有3 亿张图片,标记为18291 个类别。图片标注的来源包括原始网络信号,网页之间的联系,以及用户的反馈。因为不是由人标注的,所以含有20% 的噪音。

结论是:增大数据量果然有益。虽然图片标记含有噪音,算法的准确率还是提高了3 个百分点。很明显,数据量的增加克服了标记的噪音。研究人员发现算法的表现和数据量呈对数关系上升,如图所示。论文作者认为,现有的模型是基于一百万张图片建立的:如果对模型进行调整,准确率还有上升空间。

研究人员在微软的 COCO 对象检测基准测试上进行了测试,结果喜人:平均正确率 (AP) 从 34.3 上升到 37.4。Google 和 CMU 在 ICCV 会议上发布了算法和评测,并发布了论文《重新审视深度学习时代数据的非理性效果》,可在arxiv 自由获取。

查看英文原文 Researchers Improve State of the Art in Image Recognition Using Data Set With 300 Million Images


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-08-03 19:003640

评论

发布
暂无评论
发现更多内容

集团总部与分公司组网:选择MPLS还是SD-WAN?

Ogcloud

SD-WAN 企业组网 企业网络 SD-WAN组网 SD-WAN服务商

TiDB 关联子查询及半连接的优化实践

PingCAP

数据库 #TiDB

鸿蒙安全控件之保存控件简介

龙儿筝

鸿蒙ArkUI-X已更新适配API13啦

龙儿筝

阿里巴巴热卖商品推荐API接口的获取与应用

科普小能手

阿里巴巴 电商 API API 接口 阿里巴巴数据采集

实战丨证券 HTAP 混合业务场景的难点问题应对

PingCAP

数据库 #TiDB

如何通过ETLCloud做企业级数据集成

RestCloud

数据分析 ETL 数据集成 企业数据集成

大厂扎堆入局,AI眼镜迎来“iPhone时刻”?

趣解商业

百度 科技 AI眼镜

Perplexity 计划推出低价语音问答硬件;/dev/agents:AI Agents 的操作系统,种子轮估值 5 亿

声网

面基超快乐!和鲸社区亮相 PyCon China 2024 社区展

ModelWhale

Python 数据挖掘 机器学习 深度学习 数据库

活动回顾丨云原生开源开发者沙龙·杭州站回放 & PPT 下载

阿里巴巴云原生

阿里云 云原生

PPT页面怎么批量添加LOGO图标?2个PPT制作技巧盘点!

职场工具箱

职场 PPT 办公软件 效率软件 AI生成PPT

Lumoz TGE前的最佳机会,NFT助力提前解锁esMOZ

石头财经

华中科技大学鲲鹏昇腾科教创新孵化中心揭牌,产学研合作再结硕果

极客天地

《可观测性体系建设100问》第二章—可观测性技术应用正式发布!实战应用,深化理解

博睿数据

星闪与Wi-Fi 7一相逢,便点亮智家无数

脑极体

AI

工业 5.0 时代的数字孪生:迈向高效和可持续的智能工厂

Altair RapidMiner

工业 制造业 数字孪生 仿真 altair

HarmonyOS 5.0应用开发——装饰器的使用

高心星

huawei HarmonyOS HarmonyOS NEXT

鸿蒙安全控件之位置控件简介

龙儿筝

鸿蒙ArkUI-X简介

龙儿筝

决战毫秒间!火山引擎联合奇游,竞技游戏快人一步

火山引擎边缘云

边缘计算 游戏 游戏加速 边缘计算平台

从微软 SSAS 到国产替代,这家企业终于松了一口气

Kyligence

Lumoz TGE在即,NFT助力提前解锁esMOZ

BlockChain先知

Lumoz TGE在即,NFT助力提前解锁esMOZ

股市老人

Google使用3亿张图片大幅度改进图像识别算法_Google_Roland Meertens_InfoQ精选文章