2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Google 使用 3 亿张图片大幅度改进图像识别算法

  • 2017-08-03
  • 本文字数:671 字

    阅读完需:约 2 分钟

Google 和 CMU 的研究员使用 3 亿张图片,在图像识别算法的几个指标上取得了长足改进,而往常的训练一般只使用一百万张图片。

很多开发者在训练物体检测算法时会使用包含一百万张图片的 ImageNet 数据集。这个数据集从 2011 年起就没有新图片加入了。然而,在该数据集上训练的神经网络中的参数数量与日俱增,训练模型的 GPU 算力也在增加。卡内基梅隆大学(CMU)中 Google 的研究人员和科学家提出:如果增加训练数据量会如何?

于是,Google 建立了一个内部数据集,含有3 亿张图片,标记为18291 个类别。图片标注的来源包括原始网络信号,网页之间的联系,以及用户的反馈。因为不是由人标注的,所以含有20% 的噪音。

结论是:增大数据量果然有益。虽然图片标记含有噪音,算法的准确率还是提高了3 个百分点。很明显,数据量的增加克服了标记的噪音。研究人员发现算法的表现和数据量呈对数关系上升,如图所示。论文作者认为,现有的模型是基于一百万张图片建立的:如果对模型进行调整,准确率还有上升空间。

研究人员在微软的 COCO 对象检测基准测试上进行了测试,结果喜人:平均正确率 (AP) 从 34.3 上升到 37.4。Google 和 CMU 在 ICCV 会议上发布了算法和评测,并发布了论文《重新审视深度学习时代数据的非理性效果》,可在arxiv 自由获取。

查看英文原文 Researchers Improve State of the Art in Image Recognition Using Data Set With 300 Million Images


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-08-03 19:003805

评论

发布
暂无评论
发现更多内容

使用 Databend 全新体验!一文看懂 Databend 可视化管控平台 BendDeploy

Databend

提高敏捷性,塑造财务规划的未来趋势

智达方通

企业管理 全面预算管理 财务管理

手把手教你如何利用CodeBuddy编写属于自己的AI助手

芯动大师

CodeBuddy首席试玩官

INFINI Console 纳管 Elasticsearch 9(一):指标监控、数据管理、DSL 语句执行

极限实验室

elasticsearch console

AIGC 创作者必备!梦精灵提示词管理器让创作效率起飞​

龙正哲

DotNet 入门(二):项目运行

北桥苏

.net

哈尔滨等保测评、等保测评公司、机构怎么选

黑龙江陆陆信息测评部

Apache Seatunnel & Amazon Bedrock 助力生成式 AI 应用规模化生产实践

亚马逊云科技 (Amazon Web Services)

2025杭州国际安防产品展会(杭州安博会)团队走进石家庄宣传

AIOTE智博会

安防展 安博会 浙江安博会 杭州安博会

MCP教程:一文教你用 Trae 实现网页自动化测试

TRAE.ai

计算机 #程序员 Trae

最新日程!Altair 区域技术交流会华东站:邀您共探仿真智能化实践

Altair RapidMiner

人工智能 AI 数字孪生 仿真 CAE

等保测评、黑龙江等保。等保测评公司

黑龙江陆陆信息测评部

LLM“力大砖飞”的时代,OCR专有模型还有意义吗?

合合技术团队

算法 OCR 大模型 #人工智能

联想百应智能体新升级,卡位AI战局的“锁钥之地”

脑极体

AI

Blender 入门教程(一):模型创建

北桥苏

blender

就在下周丨中煤科工、山东临工 、中国农机院、中建科…共探离散元仿真技术新视界

Altair RapidMiner

仿真 CAE 离散元仿真 工程机械 颗粒仿真

Uniapp开发鸿蒙购物项目实战教程:实现首页轮播图

幽蓝计划

鸿蒙跨平台开发

MCP 协议为何不如你想象的安全?从技术专家视角解读

Baihai IDP

程序员 AI LLM AI Agent MCP协议

得物自研DSearch3.0搜索核心引擎升级之路

得物技术

搜索引擎

Playwright和Selenium,深度解析两大测试框架的“王者之争”

测试人

软件测试 playwright selenium

链上交易平台 MyStonks 上线美股代币链上市场,首批 5000 万美元美股资产由富达托管

TechubNews

一键三连不求人!用 CodeBuddy 写个浏览器插件自动点赞、评论、收藏

不惑

CodeBuddy首席试玩官

Blender 入门教程(二):纹理绘制

北桥苏

建模 blender

在Oracle到GreatSQL迁移中排序规则改变引发的乱码问题分析及解决

GreatSQL

《算法导论(第4版)》阅读笔记:p49-p58

codists

算法

5月15日,向量数据库:数据库与AI的交叉点”线上技术直播,文附详细演讲介绍!

NineData

AI Milvus 向量数据库 NineData 数据库与 AI 的交叉点

【HarmonyOS next】ArkUI-X休闲益智猜字谜【基础】

RunkBear

iOS Developer HarmonyOS NEXT ArkUI框架

2个小时!我自己搭建了一套安全管理系统!

中烟创新

Note16新机594元起,魅族要“逆天”?

趣解商业

科技 汽车 魅族 数码

Google使用3亿张图片大幅度改进图像识别算法_Google_Roland Meertens_InfoQ精选文章