限时领|《AI 百问百答》专栏课+实体书(包邮)! 了解详情
写点什么

Python 之父宣布退休;谷歌推出 TensorFlow 企业版;OpenAI 随时准备开源 GPT-2 完整代码 | AI 一周资讯

  • 2019-11-03
  • 本文字数:3997 字

    阅读完需:约 13 分钟

Python之父宣布退休;谷歌推出 TensorFlow企业版;OpenAI随时准备开源GPT-2完整代码 | AI一周资讯

资讯

谷歌正式推出 TensorFlow 企业版

谷歌的 TensorFlow 机器学习框架于 2015 年开源,并迅速成为最受欢迎的机器学习平台之一。到目前为止,已经被下载 4600 万次。但如果企业想使用它,就必须和第三方合作或者自己开发维护,很多企业在 TensorFlow 的早期版本中投入了大量资金。为了帮助这些公司并占领企业市场,谷歌推出 TensorFlow Enterprise,将包括实施级别的企业级支持和优化的 Google Cloud 托管服务。



TensorFlow Enterprise 旨在为大型企业提供其开源机器学习框架 TensorFlow 的优化版本。它可与 Google 的 AI 平台和 Kubernetes 引擎以及 Deep Learning VM 和 Deep Learning Containers 的优化版本一起使用。这项服务提供了高达 3 倍的数据读取改进(TensorFlow 读取和缓存文件方式更改的结果)。并且已针对 Nvidia GPU 和 Google Cloud TPU 优化了企业版。

一年间从研究到生产:谷歌将BERT应用到搜索引擎

为了让该技术对搜索结果和精选摘要进行排序,谷歌训练了一批“BERT”NLP 模型,并将它们应用到搜索引擎中。这可算得上是谷歌迈出的一大步了。多年来,谷歌的搜索算法一直是公司营收的主要来源,它的组件也是严格保密的。目前,谷歌在该项目上有了很大的进展,公司预期 BERT 系统应用在 10%的搜索结果中,这对于一个作为研究论文出版不到一年的技术来说是个不小的成就了。


BERT 到底是什么,为什么备受瞩目?

BERT 是Transformer中 Bidirectional Encoder Representations 的缩写,于 2018 年 10 月由谷歌发布,因其在问题答复到语言推理等不同任务上的卓越表现而引发关注。BERT 是近期 NLP(GPT、GPT2、ULMFiT 和 roBERTa)等模型中的一部分,这些模型的系统性能较之前有了很大改进,因此一些研究人员会称 NLP 正处于它的“高光时刻”。谷歌充分利用了 BERT 的优越性并且将其加入到了搜索引擎中,这也从侧面说明了这些技术兼具了研究和商业价值。

看未来 AI 如何关掉“美颜”和“滤镜”

人工智能深度换脸技术(Deepfake)是通过 AI 系统对图片和视频进行合成的一种技术,但是它也给人们带来了一些困扰,人们甚至会质疑在网上看到的内容的真实性。因此,我们要找到一种方式来解决这个问题,让人们电子世界中也能建立信任。目前,Facebook、Microsoft、Amazon Web Services 和 AI 领域合伙伙伴正在发起 Deepfake 检测挑战,以鼓励大众对于 Deepfake 检测技术的研究。



Facebook 公司的人工智能 Red Team 发布了一个“预置数据集”,里面包含了约 5000 个视频,既有原创,也有经过处理的。为了建立数据集,研究人员向大众征集视频,以此来保证视频中性别、年龄和肤色的多样性。据研究人员称,与以往数据集不同的是,Facebook 收集的数据集都是经过了参与者同意的,并且他们对里面使用或修改的部分无异议。


Deepfake 检测数据集对付那些想要依靠“造假”来逃避检测的坏人也很有用。因此,Facebook 制定了一个预防措施——研究人员需要注册才能访问数据集,在数据访问中添加这样的小障碍可以极大地减少不良行为。


这种发起挑战的方式可以让人工之智能社区将关注点集中在某一个问题上。而那些大型数据集发布的竞赛关注度会更高,也更加能促进“疑难杂症”的解决。

比 Horovod/NCCL 快 8 倍!伯克利与微软联合发布最优 GPU 通信库 Blink

当下大规模分布式机器学习模型训练中,数据并行是最广为使用的方法。随着 GPU 的算力不断提升,GPU 间的数据聚合(即模型同步)成为了大规模分布式模型训练的瓶颈。当下流行的数据聚合库函数(Nvidia 的 NCCL,百度的 Ring-AllReduce)或分布式模型训练平台(例如 Uber 的 Horovod)并没有很好地解决 GPU 间数据通信的问题。



利用现有的 Horovord 或 NCCL,GPU 间数据聚合可能会占到模型训练总耗时的 50% 到 90%。这些现有 GPU 间数据聚合解决方案的最大问题在于:无法充分利用所有的,同构 / 异构的数据通信通道。因此,UC Berkeley、Microsoft Research 和 University of Wisconsin-Madison 联合发布,利用 GPU 间所有异构数据传输通道,实现数据聚合的最优解决方案 Blink。相比 NCCL/Horovod,Blink 提高 GPU 间数据聚合的通信效率高达 8 倍,最多可以缩短分布式机器学习模型总训练时间的 40%。

Python 之父宣布退休

10 月 30 日,Python 之父 Guido 大牛宣布退休,离开 Dropbox。


他发推文说,“这件事感觉既苦涩又甜蜜:苦涩的是,我马上要离开 Dropbox,现在已经退休;甜蜜的是,在 Dropbox 做工程师期间,我学到很多,比如类型标注就来自这段经历。我会非常怀念在这里工作的日子。”



Python 最初是荷兰程序员 Guido van Rossum 的一个个人项目。20 世纪 80 年代末,van Rossum 在荷兰国家数学和计算机科学研究中心的 CWI 部门开发分布式系统。由于对已有的编程语言感到十分失望,他决定开发一门新的语言——一门既易于使用功能又强大的语言。


1991 年,van Rossum 通过 alt.sources 新闻组向全世界发布了 Python。这在当时基本上算是一种开源许可协议,比”开源许可协议“这个术语本身早了六年出现。虽然当时的 Python 解释器仍然需要将 21 个单独的部分连接成一个压缩文件,并需要连夜从 Usenet 网络上下载下来,但与几年前线下送磁带的方式相比,它仍然要高效得多。

OpenAI 随时可能发布GPT-2全部版本

今年年初,OpenAI 宣布开发出了一个大型语言模型,可以生成合成文本,名为 GPT-2。出于谨慎考虑,公司并没有公开 GPT-2 的所有代码,同时也是担心它可能被误用。此后,公司便采用了“分阶段发布”的方式,分阶段地发布模型,并与合作伙伴一起进行研究,试图了解可能存在的各种隐患。



5 月,OpenAI 发布了一个 3.5 亿参数的版本,并宣布将与有限的合作伙伴共享 7.62 亿参数和 15 亿参数,同时他们也在研究针对恶意使用 GPT-2 的对策。经过了近一年时间的质疑和争论,OpenAI 表示随时可能将 GPT-2 最终及全部版本发布出来。

百度 CFO 余正钧被曝将于 11 月离职 官方予以“坚决否认”

据 Tech 星球报道,百度 CFO 余正钧或将于 11 月正式离职。如果办理离职手续,最晚离职时间预计会在 11 月底。报道称,有百度内部人士透露,百度内部沟通工具“百度 Hi”上已无余正钧的相关信息。



近期,已有多位百度高管被传离职。9 月 30 日,有媒体报道,百度副总裁王路将离职,且这是他在百度的最后一天。离职后,王路或将出任一家美元基金中国区负责人。自 2016 年 9 月加入百度后,王路一直负责公共关系、市场、政府关系、职业道德建设等业务,去年他还主导了百度智慧城市项目。近日有媒体称,于今年 7 月离职的原百度糯米总经理傅海波已经确认创业,创办量子像素,主要聚焦下沉市场的本地生活服务。据悉目前,该项目已经获得天使轮融资,投资方为御势资本。值得一提地是,据 财经涂鸦报道, 原原百度高级副总裁向海龙是御势资本的 LP 之一。


此外,今年以来,百度还有多位高管出走,包括百度高级副总裁向海龙、百度副总裁顾国栋、百度副总裁吴海锋、百度副总裁郑子斌、政府关系副总裁赵承、百度执行总监孙雯玉,上述高管大多为百度的“老人”,向海龙、吴海峰、孙雯玉、赵承均在百度任职十年以上。

声音

微众银行人工智能首席科学家范力欣:推进联邦学习 IEEE 标准是奠基性的贡献

2019 年 10 月 26 日,中国计算机学会(CCF)在中国科学院计算技术研究所举行了主题为“AI 联邦学习的最新应用落地”的研讨会,现场来自腾讯、华为、微众、平安等联邦学习头部企业的代表,展示了新一代联邦学习技术在各行各业的应用范例。



微众银行人工智能首席科学家范力欣博士在会上为读者深入解答了有关联邦学习的前沿技术及行业应用问题。


范力欣博士表示:如今我们正在经历互联网的第四次信息革命,坐拥海量的信息与数据。“对这些数据利用人工智能进行解读和整合,将对我们生活的方方面面产生深远的影响。”为了挖掘海量信息背后的知识,让所有的数据以安全合规的方式进行 AI 建模,联邦学习正是应运而生。联邦学习这一新兴的 AI 技术已经相继落地于各行各业,在智慧城市、智慧终端、智慧医疗等领域都取得了突出的成果。

苹果联合创始人:我真的要放弃 L5 自动驾驶

“我甚至不知道能不能活着看到它(L5 级自动驾驶)。”Steve Wozniak 在上周于拉斯维加斯举行的 JD Power Auto Revolution 会议上如是说。


不少人都曾幻想过这样的场景:一辆辆“陆地巡洋舰”将像人类一样驾驶并对路况做出及时反应,完全不需要方向盘的控制。Wozniak 也曾抱有这样的希望,也正因如此,多年来他一直被传将担任苹果自动驾驶部门的掌门人。



苹果联合创始人 Steve Wozniak


但是,传言既没有成真,Wozniak 也对自动驾驶降低了期望。他认为,对于自动驾驶汽车来说,道路上的不可预测性实在太多了。目前,他认为新兴技术只是可以更好地为驾驶员提供某些情况下的安全辅助。


但是 Wozniak 仍然坚信:自动驾驶汽车的发展会更好。当前无人驾驶系统的现实与消费者的期望不符,Wozniak 并不认为这是研发人员的错。

蔚来李斌:自动驾驶像通信行业,不会全球统一

10 月 25 日,蔚来汽车创始人李斌在中国电动汽车百人会主办的全球未来出行大会上发表了关于未来出行的演讲。李斌表示,以自动驾驶为核心的未来出行,不可能形成全球统一的状况。原因很简单。自动驾驶能真正应用,绝不是仅靠车辆的感知分析就能完成,而是要有基础设施和一系列的周边产业,建设成一个完整的生态。以最基础的网络来说,自动驾驶汽车就像手机一样,必须接入某一家通信运营商才行。



蔚来汽车创始人李斌


另外,各个国家的驾驶环境都不一样,不管是路况或是自动驾驶的场景,因而在最后的产品表现上,各国的技术路线都不会完全相同。比如中国会强调 V2X(车路协同)的路线,而美国不会把车路协同摆在重要位置。因此,在现有的全球汽车行业供应链和品牌之上,又会多出一个重要的产业角色:本地的数据和服务运营商。


李斌说到,自动驾驶给人们带来的最大的两个好处,一个是把车上驾驶员的时间解放出来,另外一个是减少交通事故伤亡的人数。目的是解放生产力,保障生命安全。


2019-11-03 14:004202

评论

发布
暂无评论
发现更多内容

浅析 python 一切皆对象

蓬蒿

Python python对象 一切皆对象

Elasticsearch简介以及索引原理

数新网络官方账号

Flink CDC

数新网络官方账号

CDC工具之Debezium

数新网络官方账号

代码覆盖率最佳实践

数新网络官方账号

Kotlin 学习笔记(二)—— 数据类、密闭类、循环写法以及常用集合操作符

修之竹

android kotlin

帮师姐把100个Excel中符合条件的数据,汇总到1个Excel里

程序员晚枫

Python Excel 自动化办公

Handler消息传递机制浅析

芯动大师

Activity Handler runOnUiThread

Kubernetes 简介及其调度原理

数新网络官方账号

CDC工具之Canal

数新网络官方账号

mybatis xml文件热加载实现

越长大越悲伤

mybatis springboot java

往往排查很久的问题,最后发现都非常简单。。。

艾小仙

Java kafka spring

前缀和算法练习集

timerring

前缀和

华为云ECS/HECS:中小企业上云第一步

IT科技苏辞

为什么大家都喜欢“人天”作为估算单位?

Bruce Talk

Scrum 敏捷开发 Agile

压缩解压工具:Keka中文版

真大的脸盆

Mac Mac 软件 压缩工具 解压缩软件 解压软件

矢量绘图UI设计:Sketch 95.3中文激活版

真大的脸盆

Mac UI Mac 软件 ui设计

如何选择合适的智慧公厕设备厂家?

光明源智慧厕所

智慧城市

浅谈Spark分布式计算

数新网络官方账号

赠票 | 在北京,见证边缘的力量

俞凡

架构实战营-模块六作业(拆分电商系统为微服务)

🐢先生

架构实战营

两个比较容易混淆的函数

Joseph295

Web3社交网络的另一种思路 - Oi! Network解析

股市老人

浅谈数据仓库工具——Hive

数新网络官方账号

【Redis源码分析】Server启动过程

零点999

redis Redis 协议 Redis 核心技术与实战 Redis 数据结构 redis 底层原理

明道云在制造行业的五个实施案例与建议

明道云

关于GPT-4的产品化狂想

脑极体

AI

面试高频问题之C++编译过程

小万哥

c++ 程序员 后端 编译 开发

机器学习算法(五):基于企鹅数据集的决策树分类预测

汀丶人工智能

数据挖掘 机器学习 决策树

Python之父宣布退休;谷歌推出 TensorFlow企业版;OpenAI随时准备开源GPT-2完整代码 | AI一周资讯_AI&大模型_李冬梅_InfoQ精选文章