最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

Python 之父宣布退休;谷歌推出 TensorFlow 企业版;OpenAI 随时准备开源 GPT-2 完整代码 | AI 一周资讯

  • 2019-11-03
  • 本文字数:3997 字

    阅读完需:约 13 分钟

Python之父宣布退休;谷歌推出 TensorFlow企业版;OpenAI随时准备开源GPT-2完整代码 | AI一周资讯

资讯

谷歌正式推出 TensorFlow 企业版

谷歌的 TensorFlow 机器学习框架于 2015 年开源,并迅速成为最受欢迎的机器学习平台之一。到目前为止,已经被下载 4600 万次。但如果企业想使用它,就必须和第三方合作或者自己开发维护,很多企业在 TensorFlow 的早期版本中投入了大量资金。为了帮助这些公司并占领企业市场,谷歌推出 TensorFlow Enterprise,将包括实施级别的企业级支持和优化的 Google Cloud 托管服务。



TensorFlow Enterprise 旨在为大型企业提供其开源机器学习框架 TensorFlow 的优化版本。它可与 Google 的 AI 平台和 Kubernetes 引擎以及 Deep Learning VM 和 Deep Learning Containers 的优化版本一起使用。这项服务提供了高达 3 倍的数据读取改进(TensorFlow 读取和缓存文件方式更改的结果)。并且已针对 Nvidia GPU 和 Google Cloud TPU 优化了企业版。

一年间从研究到生产:谷歌将BERT应用到搜索引擎

为了让该技术对搜索结果和精选摘要进行排序,谷歌训练了一批“BERT”NLP 模型,并将它们应用到搜索引擎中。这可算得上是谷歌迈出的一大步了。多年来,谷歌的搜索算法一直是公司营收的主要来源,它的组件也是严格保密的。目前,谷歌在该项目上有了很大的进展,公司预期 BERT 系统应用在 10%的搜索结果中,这对于一个作为研究论文出版不到一年的技术来说是个不小的成就了。


BERT 到底是什么,为什么备受瞩目?

BERT 是Transformer中 Bidirectional Encoder Representations 的缩写,于 2018 年 10 月由谷歌发布,因其在问题答复到语言推理等不同任务上的卓越表现而引发关注。BERT 是近期 NLP(GPT、GPT2、ULMFiT 和 roBERTa)等模型中的一部分,这些模型的系统性能较之前有了很大改进,因此一些研究人员会称 NLP 正处于它的“高光时刻”。谷歌充分利用了 BERT 的优越性并且将其加入到了搜索引擎中,这也从侧面说明了这些技术兼具了研究和商业价值。

看未来 AI 如何关掉“美颜”和“滤镜”

人工智能深度换脸技术(Deepfake)是通过 AI 系统对图片和视频进行合成的一种技术,但是它也给人们带来了一些困扰,人们甚至会质疑在网上看到的内容的真实性。因此,我们要找到一种方式来解决这个问题,让人们电子世界中也能建立信任。目前,Facebook、Microsoft、Amazon Web Services 和 AI 领域合伙伙伴正在发起 Deepfake 检测挑战,以鼓励大众对于 Deepfake 检测技术的研究。



Facebook 公司的人工智能 Red Team 发布了一个“预置数据集”,里面包含了约 5000 个视频,既有原创,也有经过处理的。为了建立数据集,研究人员向大众征集视频,以此来保证视频中性别、年龄和肤色的多样性。据研究人员称,与以往数据集不同的是,Facebook 收集的数据集都是经过了参与者同意的,并且他们对里面使用或修改的部分无异议。


Deepfake 检测数据集对付那些想要依靠“造假”来逃避检测的坏人也很有用。因此,Facebook 制定了一个预防措施——研究人员需要注册才能访问数据集,在数据访问中添加这样的小障碍可以极大地减少不良行为。


这种发起挑战的方式可以让人工之智能社区将关注点集中在某一个问题上。而那些大型数据集发布的竞赛关注度会更高,也更加能促进“疑难杂症”的解决。

比 Horovod/NCCL 快 8 倍!伯克利与微软联合发布最优 GPU 通信库 Blink

当下大规模分布式机器学习模型训练中,数据并行是最广为使用的方法。随着 GPU 的算力不断提升,GPU 间的数据聚合(即模型同步)成为了大规模分布式模型训练的瓶颈。当下流行的数据聚合库函数(Nvidia 的 NCCL,百度的 Ring-AllReduce)或分布式模型训练平台(例如 Uber 的 Horovod)并没有很好地解决 GPU 间数据通信的问题。



利用现有的 Horovord 或 NCCL,GPU 间数据聚合可能会占到模型训练总耗时的 50% 到 90%。这些现有 GPU 间数据聚合解决方案的最大问题在于:无法充分利用所有的,同构 / 异构的数据通信通道。因此,UC Berkeley、Microsoft Research 和 University of Wisconsin-Madison 联合发布,利用 GPU 间所有异构数据传输通道,实现数据聚合的最优解决方案 Blink。相比 NCCL/Horovod,Blink 提高 GPU 间数据聚合的通信效率高达 8 倍,最多可以缩短分布式机器学习模型总训练时间的 40%。

Python 之父宣布退休

10 月 30 日,Python 之父 Guido 大牛宣布退休,离开 Dropbox。


他发推文说,“这件事感觉既苦涩又甜蜜:苦涩的是,我马上要离开 Dropbox,现在已经退休;甜蜜的是,在 Dropbox 做工程师期间,我学到很多,比如类型标注就来自这段经历。我会非常怀念在这里工作的日子。”



Python 最初是荷兰程序员 Guido van Rossum 的一个个人项目。20 世纪 80 年代末,van Rossum 在荷兰国家数学和计算机科学研究中心的 CWI 部门开发分布式系统。由于对已有的编程语言感到十分失望,他决定开发一门新的语言——一门既易于使用功能又强大的语言。


1991 年,van Rossum 通过 alt.sources 新闻组向全世界发布了 Python。这在当时基本上算是一种开源许可协议,比”开源许可协议“这个术语本身早了六年出现。虽然当时的 Python 解释器仍然需要将 21 个单独的部分连接成一个压缩文件,并需要连夜从 Usenet 网络上下载下来,但与几年前线下送磁带的方式相比,它仍然要高效得多。

OpenAI 随时可能发布GPT-2全部版本

今年年初,OpenAI 宣布开发出了一个大型语言模型,可以生成合成文本,名为 GPT-2。出于谨慎考虑,公司并没有公开 GPT-2 的所有代码,同时也是担心它可能被误用。此后,公司便采用了“分阶段发布”的方式,分阶段地发布模型,并与合作伙伴一起进行研究,试图了解可能存在的各种隐患。



5 月,OpenAI 发布了一个 3.5 亿参数的版本,并宣布将与有限的合作伙伴共享 7.62 亿参数和 15 亿参数,同时他们也在研究针对恶意使用 GPT-2 的对策。经过了近一年时间的质疑和争论,OpenAI 表示随时可能将 GPT-2 最终及全部版本发布出来。

百度 CFO 余正钧被曝将于 11 月离职 官方予以“坚决否认”

据 Tech 星球报道,百度 CFO 余正钧或将于 11 月正式离职。如果办理离职手续,最晚离职时间预计会在 11 月底。报道称,有百度内部人士透露,百度内部沟通工具“百度 Hi”上已无余正钧的相关信息。



近期,已有多位百度高管被传离职。9 月 30 日,有媒体报道,百度副总裁王路将离职,且这是他在百度的最后一天。离职后,王路或将出任一家美元基金中国区负责人。自 2016 年 9 月加入百度后,王路一直负责公共关系、市场、政府关系、职业道德建设等业务,去年他还主导了百度智慧城市项目。近日有媒体称,于今年 7 月离职的原百度糯米总经理傅海波已经确认创业,创办量子像素,主要聚焦下沉市场的本地生活服务。据悉目前,该项目已经获得天使轮融资,投资方为御势资本。值得一提地是,据 财经涂鸦报道, 原原百度高级副总裁向海龙是御势资本的 LP 之一。


此外,今年以来,百度还有多位高管出走,包括百度高级副总裁向海龙、百度副总裁顾国栋、百度副总裁吴海锋、百度副总裁郑子斌、政府关系副总裁赵承、百度执行总监孙雯玉,上述高管大多为百度的“老人”,向海龙、吴海峰、孙雯玉、赵承均在百度任职十年以上。

声音

微众银行人工智能首席科学家范力欣:推进联邦学习 IEEE 标准是奠基性的贡献

2019 年 10 月 26 日,中国计算机学会(CCF)在中国科学院计算技术研究所举行了主题为“AI 联邦学习的最新应用落地”的研讨会,现场来自腾讯、华为、微众、平安等联邦学习头部企业的代表,展示了新一代联邦学习技术在各行各业的应用范例。



微众银行人工智能首席科学家范力欣博士在会上为读者深入解答了有关联邦学习的前沿技术及行业应用问题。


范力欣博士表示:如今我们正在经历互联网的第四次信息革命,坐拥海量的信息与数据。“对这些数据利用人工智能进行解读和整合,将对我们生活的方方面面产生深远的影响。”为了挖掘海量信息背后的知识,让所有的数据以安全合规的方式进行 AI 建模,联邦学习正是应运而生。联邦学习这一新兴的 AI 技术已经相继落地于各行各业,在智慧城市、智慧终端、智慧医疗等领域都取得了突出的成果。

苹果联合创始人:我真的要放弃 L5 自动驾驶

“我甚至不知道能不能活着看到它(L5 级自动驾驶)。”Steve Wozniak 在上周于拉斯维加斯举行的 JD Power Auto Revolution 会议上如是说。


不少人都曾幻想过这样的场景:一辆辆“陆地巡洋舰”将像人类一样驾驶并对路况做出及时反应,完全不需要方向盘的控制。Wozniak 也曾抱有这样的希望,也正因如此,多年来他一直被传将担任苹果自动驾驶部门的掌门人。



苹果联合创始人 Steve Wozniak


但是,传言既没有成真,Wozniak 也对自动驾驶降低了期望。他认为,对于自动驾驶汽车来说,道路上的不可预测性实在太多了。目前,他认为新兴技术只是可以更好地为驾驶员提供某些情况下的安全辅助。


但是 Wozniak 仍然坚信:自动驾驶汽车的发展会更好。当前无人驾驶系统的现实与消费者的期望不符,Wozniak 并不认为这是研发人员的错。

蔚来李斌:自动驾驶像通信行业,不会全球统一

10 月 25 日,蔚来汽车创始人李斌在中国电动汽车百人会主办的全球未来出行大会上发表了关于未来出行的演讲。李斌表示,以自动驾驶为核心的未来出行,不可能形成全球统一的状况。原因很简单。自动驾驶能真正应用,绝不是仅靠车辆的感知分析就能完成,而是要有基础设施和一系列的周边产业,建设成一个完整的生态。以最基础的网络来说,自动驾驶汽车就像手机一样,必须接入某一家通信运营商才行。



蔚来汽车创始人李斌


另外,各个国家的驾驶环境都不一样,不管是路况或是自动驾驶的场景,因而在最后的产品表现上,各国的技术路线都不会完全相同。比如中国会强调 V2X(车路协同)的路线,而美国不会把车路协同摆在重要位置。因此,在现有的全球汽车行业供应链和品牌之上,又会多出一个重要的产业角色:本地的数据和服务运营商。


李斌说到,自动驾驶给人们带来的最大的两个好处,一个是把车上驾驶员的时间解放出来,另外一个是减少交通事故伤亡的人数。目的是解放生产力,保障生命安全。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-11-03 14:003887

评论

发布
暂无评论
发现更多内容

对比下 datax 的 OceanBase/MYSQL 不同数据同步方案的效率差异 || 聊聊参数 rewriteBatchedStatements

明哥的IT随笔

数据库

在 Kubernetes 上安装和运行极狐GitLab实例

极狐GitLab

Kubernetes 极狐GitLab

参加开源贡献后,大厂向我抛出了橄榄枝

openLooKeng

回顾明道云的2021(文末互动有奖)

明道云

Hive SQL底层执行过程 | 社区征文

五分钟学大数据

hive 新春征文

研发转岗产品经理,有什么需要注意的呢?

石云升

产品经理 产品思维 1月月更

设计模式之工厂模式

Catch

设计模式

“中国智能科学技术最高奖”公布,华为云田奇获杰出贡献奖

Geek_2d6073

实现科技自立自强,各企业如何发力?

脑极体

手把手教你在优麒麟上搭建 RISC-V 交叉编译环境

优麒麟

Linux 开源 开发者 risc-v 优麒麟

TDSQL | 《checkpoint原理浅析》

腾讯云数据库

tdsql 国产数据库

设计模式之单例模式

Catch

设计模式

Spark 核心详解

五分钟学大数据

spark 1月月更

详解 Flink CEP(以直播平台监控用户弹幕为例)

五分钟学大数据

flink 1月月更

Luna:你想要的 React Native 调试工具

Shopee技术团队

前端 开发者工具 React Native

分布式项目中,选型与依赖管理

架构 分布式 微服务 架构设计

[架构实战营]第六模块作业

Vincent

「架构实战营」

CVE-2021-4034 Linux Polkit 权限提升漏洞挖掘思路解读

腾讯安全云鼎实验室

云原生 漏洞分析

架构训练营 week7 课程总结

红莲疾风

「架构实战营」

Flink Keyed State 对 Key 的管理机制解析

邸星星

flink 状态管理 Flink KeyedState

开发postgreSQL connector支持update/delete操作的代码

openLooKeng

夜莺系统调研报告

苍狼

AI贺新年,开发者的虎年这样过才有意思

华为云开发者联盟

AI 华为云

TDSQL | TXSQL数据库内核与特性

腾讯云数据库

tdsql 国产数据库

18M 超轻量图像识别系统,商品、车辆、人脸识别一网打尽!

百度大脑

架构实战营 - 群讨论汇总 (2022)

华仔

#架构实战营

创梦天地发行公益性数字艺术藏品,打造不一样的年味

科技热闻

看看 InfoQ 的编辑和各大厂技术专家们,如何盘点技术圈的 2021

InfoQ写作社区官方

2021年度技术盘点与展望

架构训练营 week7 作业

红莲疾风

「架构实战营」

TDSQL | DTS for PostgreSQL 逻辑复制详解

腾讯云数据库

tdsql 国产数据库

设计模式之设计原则

Catch

设计模式

Python之父宣布退休;谷歌推出 TensorFlow企业版;OpenAI随时准备开源GPT-2完整代码 | AI一周资讯_AI&大模型_李冬梅_InfoQ精选文章