写点什么

谷歌大脑:正在改变谷歌帝国的利器

  • 2014-07-24
  • 本文字数:1735 字

    阅读完需:约 6 分钟

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

对于一个互联网公司来讲,枯燥的数据标注工作是家常便饭。数据组经常花费大把的时间盯着屏幕,来标注所见数据的好坏、种类和重要性等等,用来提升应用的用户体验和广告点击率。互联网巨头谷歌也不能免俗,例如在其门牌号识别的项目中,就有很多工程师整日重复上述过程,面对屏幕,判断看到的图片是不是门牌号,然后标注结果。门牌号识别对于谷歌地图服务来讲是很重要的一部分,能够提供精确到大厦门牌号的导航会带来非常好的用户体验,然而,对于这些标注数据的员工来将,应用的重要度反而加重了他们标注工作的繁重度,意味着他们需要更加仔细的来辨认本来就很难区分的电话号码、胡乱的涂鸦和门牌号。

这种会让人歇斯底里的工作,在前几周得到了改善,据连线杂志报道,谷歌公司的一些员工训练出了一种机器学习算法,来辅助甚至代替标注员的工作。这并不是一种新的尝试,而传统的学习方法往往效果差强人意。但是,这一次,工程师采用了一套新的人工智能系统克服了以往的问题,这就是谷歌大脑系统。有了这个系统,街景地址识别的效率得到了极大的提升,法国街景团队提供的地址数据在一小时内就被谷歌大脑系统完成了地址识别。在这个过程中,机器学习算法起到决定性的作用,难怪业界都说谷歌公司不是一个搜索公司,而是一个机器学习公司。

谷歌大脑系统,三年前诞生于谷歌神秘X 实验室,此后一直处于内测状态,传闻中的无人驾驶汽车、广告点及系统、谷歌街景等都萌发自此实验室。其目标就是为软件工程师提供一流的机器学习算法,用于公司的各类业务中。和常规的项目不同,谷歌大脑可以看做是谷歌公司迈向一个全新领域的尝试,一如上一个十年它的创始人通过搜索和大规模广告系统开创天下一样的新颖。除了上文所述的地址识别以外,谷歌大脑还被用于其Android 手机的语音识别以及G+ 社交网络的图像搜索任务。谷歌大神Jeff Dean 声称现在谷歌内部大概有30-40 个项目在使用谷歌大脑系统,有一些已经产品化,有一些在初步尝试,与现有系统比较,都的到了比较乐观的结果。谷歌公司在大脑系统上的发力,可以看做是公司研发策略转向一种新的称作“深度学习”的人工智能方法的尝试。站在同一起跑线的,还有Facebook、微软、IBM、百度等巨头。竞争非常激烈,连线杂志近日报道,微软公司名为Adam 的深度学习系统,在其学术峰会上首次出现在公众面前。其亮点在于,识别种类更多,而使用的机器少一个数量级。和谷歌大脑不同,Adam 并不试图达到算法的极致,而是致力于解决计算性能的优化。百度公司也在今年发布了自己的深度学习战略,主要用于图片搜索和广告点击率预测。

谷歌公司在深度学习上的发力可以追溯至2011 年斯坦福教授吴恩达教授(现任百度研究院院长)加入“射月”实验小组开始,最早的报道来自纽约时报。此后的一年,纽约时报再次报道,吴教授所在团队通过一个1 万6 千台计算机的集群,通过模仿人脑思考模型,成功的基于1 亿张Youtube 截图教会了算法识别一只猫,同年,Android 手机语音识别的错误率降低了惊人的25%。然后谷歌公司就开始了一轮深度学习专家收购战,去年雇佣了著名的Geoff Hinton 教授,以及他的DNNResearch 公司,还斥资4 亿美元收购了深度学习游戏公司DeepMind。

有了深度学习,工程师可以构建从某种程度上模仿人脑学习的软件模型。然后在现有的海量数据上进行训练、调试最终施展于新的应用上。模型具有很好的重用特性,谷歌图片搜索训练的图片识别模型,也可以帮助谷歌地图。能改进搜索引擎结果的文字分析模型也可以帮助Google+。在谷歌的内网上,已经有相当数量的深度学习模型分享出来,Jeff Dean 团队负责其后端,而应用团队则负责提供相应的数据。机器学习模型的构建和训练是非常复杂的,需要多年的积累,但是使用却没有那么难。整个使用过程非常简单,下载源代码,调整一个配置文件,给出自己的数据,运行。

正如当年谷歌发布分布式模型MapReduce,最后造就了开源版本Hadoop,如日中天的谷歌大脑项目,正不断的以论文等形式进入大众开发者视野,下一个开源大脑会是什么样子?让我们拭目以待。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

公众号推荐:

AIGC 技术正以惊人的速度重塑着创新的边界,InfoQ 首期《大模型领航者AIGC实践案例集锦》电子书,深度对话 30 位国内顶尖大模型专家,洞悉大模型技术前沿与未来趋势,精选 10 余个行业一线实践案例,全面展示大模型在多个垂直行业的应用成果,同时,揭秘全球热门大模型效果,为创业者、开发者提供决策支持和选型参考。关注「AI前线」,回复「领航者」免费获取电子书。

2014-07-24 21:432901
用户头像

发布了 268 篇内容, 共 119.7 次阅读, 收获喜欢 24 次。

关注

评论

发布
暂无评论
发现更多内容

基于消息队列 RocketMQ 的大型分布式应用上云最佳实践

阿里巴巴云原生

阿里云 RocketMQ 云原生 消息队列 上云

【Flutter 专题】19 图解【分享页面】底部对话框

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 11月日更

架构训练营毕业总结

Clarke

架构实战营

Redis 日志篇:AOF 与 RDB 让数据持久化不丢失

码哥字节

redis 后端 Redis 核心技术与实战 11月日更

Android端信号处理总结

轻口味

android 音视频 11月日更

算法入门-插入排序

ES_her0

11月日更

架构实战营毕业总结

技术是伙伴

一部亚马逊4.5高分的领域经典,首次落地中国

博文视点Broadview

Python代码阅读(第52篇):返回列表的头部和尾部

Felix

Python List Code 列表 阅读代码

新书 | 这绝对是读起来最有趣的计算机科普绘本

图灵教育

少儿编程 绘本 逻辑启蒙

苏丹2021年10月25政变断网事件

郑州埃文科技

[ 工程师书单推荐] - 年轻人,你渴望力量吗?

baiyutang

11月日更

iOS开发:用XIB拖控件关联时报错:“Could not insert new outlet connection…”解决方法

三掌柜

11月日更

CSS架构之Theme层

Augus

CSS 11月日更

Apache APISIX 在腾讯云智能钛平台中的落地实践

API7.ai 技术团队

腾讯云 网关 API网关 Apache APISIX

架构实战营 王者荣耀商城异地多活架构设计

💤 ZZzz💤

架构实战营

实验室lims系统解决方案

低代码小观

实验室管理系统 企业管理 LIMS实验室信息管理系统 LIMS系统 信息管理系统

【设计模式】第十篇 - 外观模式 - 我来组成头部

Brave

设计模式 外观模式 11月日更

架构实战营 - 模块七作业

en

#架构实战营

在线文本纵向排版工具

入门小站

工具

尝鲜Windows 11一个月,被这3项巨变圈粉了....

Jackpop

工厂模式——猫粮公司的演进

蝉沐风

Java 设计模式 工厂模式 工厂方法模式

Apache RocketMQ 荣获 2021 中国开源云联盟优秀开源项目

阿里巴巴云原生

Apache 开源 RocketMQ 资讯

【LeetCode】有效的完全平方数Java题解

Albert

算法 LeetCode 11月日更

毕业总结

脉动

让华为举步维艰,Android曾距离成为国产系统仅一步之遥!

Jackpop

第三期3天AI进阶实战营-Day1任务卡

IT蜗壳-Tango

11月日更

如何免费下载学术文献?

Jackpop

系统架构面临的三大挑战,看 Kubernetes 监控如何解决?

阿里巴巴云原生

阿里云 Kubernetes 云原生 系统架构

把选择题变成问答题

FunTester

Java Python 测试 FunTester

NEJ Build太慢怎么办?试试MOOC NEJ吧,只需两步,提升70%构建性能!

有道技术团队

算法

谷歌大脑:正在改变谷歌帝国的利器_语言 & 开发_张天雷_InfoQ精选文章