生成式AI领域的最新成果都在这里!抢 QCon 展区门票 了解详情
写点什么

Python 之父宣布退休;谷歌推出 TensorFlow 企业版;OpenAI 随时准备开源 GPT-2 完整代码 | AI 一周资讯

  • 2019-11-03
  • 本文字数:3997 字

    阅读完需:约 13 分钟

Python之父宣布退休;谷歌推出 TensorFlow企业版;OpenAI随时准备开源GPT-2完整代码 | AI一周资讯

资讯

谷歌正式推出 TensorFlow 企业版

谷歌的 TensorFlow 机器学习框架于 2015 年开源,并迅速成为最受欢迎的机器学习平台之一。到目前为止,已经被下载 4600 万次。但如果企业想使用它,就必须和第三方合作或者自己开发维护,很多企业在 TensorFlow 的早期版本中投入了大量资金。为了帮助这些公司并占领企业市场,谷歌推出 TensorFlow Enterprise,将包括实施级别的企业级支持和优化的 Google Cloud 托管服务。



TensorFlow Enterprise 旨在为大型企业提供其开源机器学习框架 TensorFlow 的优化版本。它可与 Google 的 AI 平台和 Kubernetes 引擎以及 Deep Learning VM 和 Deep Learning Containers 的优化版本一起使用。这项服务提供了高达 3 倍的数据读取改进(TensorFlow 读取和缓存文件方式更改的结果)。并且已针对 Nvidia GPU 和 Google Cloud TPU 优化了企业版。

一年间从研究到生产:谷歌将BERT应用到搜索引擎

为了让该技术对搜索结果和精选摘要进行排序,谷歌训练了一批“BERT”NLP 模型,并将它们应用到搜索引擎中。这可算得上是谷歌迈出的一大步了。多年来,谷歌的搜索算法一直是公司营收的主要来源,它的组件也是严格保密的。目前,谷歌在该项目上有了很大的进展,公司预期 BERT 系统应用在 10%的搜索结果中,这对于一个作为研究论文出版不到一年的技术来说是个不小的成就了。


BERT 到底是什么,为什么备受瞩目?

BERT 是Transformer中 Bidirectional Encoder Representations 的缩写,于 2018 年 10 月由谷歌发布,因其在问题答复到语言推理等不同任务上的卓越表现而引发关注。BERT 是近期 NLP(GPT、GPT2、ULMFiT 和 roBERTa)等模型中的一部分,这些模型的系统性能较之前有了很大改进,因此一些研究人员会称 NLP 正处于它的“高光时刻”。谷歌充分利用了 BERT 的优越性并且将其加入到了搜索引擎中,这也从侧面说明了这些技术兼具了研究和商业价值。

看未来 AI 如何关掉“美颜”和“滤镜”

人工智能深度换脸技术(Deepfake)是通过 AI 系统对图片和视频进行合成的一种技术,但是它也给人们带来了一些困扰,人们甚至会质疑在网上看到的内容的真实性。因此,我们要找到一种方式来解决这个问题,让人们电子世界中也能建立信任。目前,Facebook、Microsoft、Amazon Web Services 和 AI 领域合伙伙伴正在发起 Deepfake 检测挑战,以鼓励大众对于 Deepfake 检测技术的研究。



Facebook 公司的人工智能 Red Team 发布了一个“预置数据集”,里面包含了约 5000 个视频,既有原创,也有经过处理的。为了建立数据集,研究人员向大众征集视频,以此来保证视频中性别、年龄和肤色的多样性。据研究人员称,与以往数据集不同的是,Facebook 收集的数据集都是经过了参与者同意的,并且他们对里面使用或修改的部分无异议。


Deepfake 检测数据集对付那些想要依靠“造假”来逃避检测的坏人也很有用。因此,Facebook 制定了一个预防措施——研究人员需要注册才能访问数据集,在数据访问中添加这样的小障碍可以极大地减少不良行为。


这种发起挑战的方式可以让人工之智能社区将关注点集中在某一个问题上。而那些大型数据集发布的竞赛关注度会更高,也更加能促进“疑难杂症”的解决。

比 Horovod/NCCL 快 8 倍!伯克利与微软联合发布最优 GPU 通信库 Blink

当下大规模分布式机器学习模型训练中,数据并行是最广为使用的方法。随着 GPU 的算力不断提升,GPU 间的数据聚合(即模型同步)成为了大规模分布式模型训练的瓶颈。当下流行的数据聚合库函数(Nvidia 的 NCCL,百度的 Ring-AllReduce)或分布式模型训练平台(例如 Uber 的 Horovod)并没有很好地解决 GPU 间数据通信的问题。



利用现有的 Horovord 或 NCCL,GPU 间数据聚合可能会占到模型训练总耗时的 50% 到 90%。这些现有 GPU 间数据聚合解决方案的最大问题在于:无法充分利用所有的,同构 / 异构的数据通信通道。因此,UC Berkeley、Microsoft Research 和 University of Wisconsin-Madison 联合发布,利用 GPU 间所有异构数据传输通道,实现数据聚合的最优解决方案 Blink。相比 NCCL/Horovod,Blink 提高 GPU 间数据聚合的通信效率高达 8 倍,最多可以缩短分布式机器学习模型总训练时间的 40%。

Python 之父宣布退休

10 月 30 日,Python 之父 Guido 大牛宣布退休,离开 Dropbox。


他发推文说,“这件事感觉既苦涩又甜蜜:苦涩的是,我马上要离开 Dropbox,现在已经退休;甜蜜的是,在 Dropbox 做工程师期间,我学到很多,比如类型标注就来自这段经历。我会非常怀念在这里工作的日子。”



Python 最初是荷兰程序员 Guido van Rossum 的一个个人项目。20 世纪 80 年代末,van Rossum 在荷兰国家数学和计算机科学研究中心的 CWI 部门开发分布式系统。由于对已有的编程语言感到十分失望,他决定开发一门新的语言——一门既易于使用功能又强大的语言。


1991 年,van Rossum 通过 alt.sources 新闻组向全世界发布了 Python。这在当时基本上算是一种开源许可协议,比”开源许可协议“这个术语本身早了六年出现。虽然当时的 Python 解释器仍然需要将 21 个单独的部分连接成一个压缩文件,并需要连夜从 Usenet 网络上下载下来,但与几年前线下送磁带的方式相比,它仍然要高效得多。

OpenAI 随时可能发布GPT-2全部版本

今年年初,OpenAI 宣布开发出了一个大型语言模型,可以生成合成文本,名为 GPT-2。出于谨慎考虑,公司并没有公开 GPT-2 的所有代码,同时也是担心它可能被误用。此后,公司便采用了“分阶段发布”的方式,分阶段地发布模型,并与合作伙伴一起进行研究,试图了解可能存在的各种隐患。



5 月,OpenAI 发布了一个 3.5 亿参数的版本,并宣布将与有限的合作伙伴共享 7.62 亿参数和 15 亿参数,同时他们也在研究针对恶意使用 GPT-2 的对策。经过了近一年时间的质疑和争论,OpenAI 表示随时可能将 GPT-2 最终及全部版本发布出来。

百度 CFO 余正钧被曝将于 11 月离职 官方予以“坚决否认”

据 Tech 星球报道,百度 CFO 余正钧或将于 11 月正式离职。如果办理离职手续,最晚离职时间预计会在 11 月底。报道称,有百度内部人士透露,百度内部沟通工具“百度 Hi”上已无余正钧的相关信息。



近期,已有多位百度高管被传离职。9 月 30 日,有媒体报道,百度副总裁王路将离职,且这是他在百度的最后一天。离职后,王路或将出任一家美元基金中国区负责人。自 2016 年 9 月加入百度后,王路一直负责公共关系、市场、政府关系、职业道德建设等业务,去年他还主导了百度智慧城市项目。近日有媒体称,于今年 7 月离职的原百度糯米总经理傅海波已经确认创业,创办量子像素,主要聚焦下沉市场的本地生活服务。据悉目前,该项目已经获得天使轮融资,投资方为御势资本。值得一提地是,据 财经涂鸦报道, 原原百度高级副总裁向海龙是御势资本的 LP 之一。


此外,今年以来,百度还有多位高管出走,包括百度高级副总裁向海龙、百度副总裁顾国栋、百度副总裁吴海锋、百度副总裁郑子斌、政府关系副总裁赵承、百度执行总监孙雯玉,上述高管大多为百度的“老人”,向海龙、吴海峰、孙雯玉、赵承均在百度任职十年以上。

声音

微众银行人工智能首席科学家范力欣:推进联邦学习 IEEE 标准是奠基性的贡献

2019 年 10 月 26 日,中国计算机学会(CCF)在中国科学院计算技术研究所举行了主题为“AI 联邦学习的最新应用落地”的研讨会,现场来自腾讯、华为、微众、平安等联邦学习头部企业的代表,展示了新一代联邦学习技术在各行各业的应用范例。



微众银行人工智能首席科学家范力欣博士在会上为读者深入解答了有关联邦学习的前沿技术及行业应用问题。


范力欣博士表示:如今我们正在经历互联网的第四次信息革命,坐拥海量的信息与数据。“对这些数据利用人工智能进行解读和整合,将对我们生活的方方面面产生深远的影响。”为了挖掘海量信息背后的知识,让所有的数据以安全合规的方式进行 AI 建模,联邦学习正是应运而生。联邦学习这一新兴的 AI 技术已经相继落地于各行各业,在智慧城市、智慧终端、智慧医疗等领域都取得了突出的成果。

苹果联合创始人:我真的要放弃 L5 自动驾驶

“我甚至不知道能不能活着看到它(L5 级自动驾驶)。”Steve Wozniak 在上周于拉斯维加斯举行的 JD Power Auto Revolution 会议上如是说。


不少人都曾幻想过这样的场景:一辆辆“陆地巡洋舰”将像人类一样驾驶并对路况做出及时反应,完全不需要方向盘的控制。Wozniak 也曾抱有这样的希望,也正因如此,多年来他一直被传将担任苹果自动驾驶部门的掌门人。



苹果联合创始人 Steve Wozniak


但是,传言既没有成真,Wozniak 也对自动驾驶降低了期望。他认为,对于自动驾驶汽车来说,道路上的不可预测性实在太多了。目前,他认为新兴技术只是可以更好地为驾驶员提供某些情况下的安全辅助。


但是 Wozniak 仍然坚信:自动驾驶汽车的发展会更好。当前无人驾驶系统的现实与消费者的期望不符,Wozniak 并不认为这是研发人员的错。

蔚来李斌:自动驾驶像通信行业,不会全球统一

10 月 25 日,蔚来汽车创始人李斌在中国电动汽车百人会主办的全球未来出行大会上发表了关于未来出行的演讲。李斌表示,以自动驾驶为核心的未来出行,不可能形成全球统一的状况。原因很简单。自动驾驶能真正应用,绝不是仅靠车辆的感知分析就能完成,而是要有基础设施和一系列的周边产业,建设成一个完整的生态。以最基础的网络来说,自动驾驶汽车就像手机一样,必须接入某一家通信运营商才行。



蔚来汽车创始人李斌


另外,各个国家的驾驶环境都不一样,不管是路况或是自动驾驶的场景,因而在最后的产品表现上,各国的技术路线都不会完全相同。比如中国会强调 V2X(车路协同)的路线,而美国不会把车路协同摆在重要位置。因此,在现有的全球汽车行业供应链和品牌之上,又会多出一个重要的产业角色:本地的数据和服务运营商。


李斌说到,自动驾驶给人们带来的最大的两个好处,一个是把车上驾驶员的时间解放出来,另外一个是减少交通事故伤亡的人数。目的是解放生产力,保障生命安全。


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2019-11-03 14:003882

评论

发布
暂无评论
发现更多内容

新形势下,2024年企业数字化转型该如何进行?

优秀

数字化转型 企业数字化转型

编程太难学?你可能还没试过这个神器

代码生成器研究

华为云耀云服务器L实例助力小程序开发的成本与效率之选

轶天下事

卓越性能下的华为云耀云服务器L实例:小程序竞争中的利器

轶天下事

SocialFi 和 GameFi 的碰撞 — Socrates 构建新的 Web3 流量入口

股市老人

Java 对象的内存布局

zurhan

RWA+AI 叙事下的 ProsperEx,对 Web3 时代交易的重新定义

股市老人

凯叔讲故事如何把好内容传递给千万儿童?

最新动态

京东商品详情 API 接口深度解析与应用

tbapi

京东技术 京东商品详情数据接口 京东API接口

企业为什么需要进行敏捷开发培训?有哪些好处?

顿顿顿

敏捷开发 敏捷项目管理 scrum培训 敏捷培训

芯片国产替代发展得怎么样了?

IC男奋斗史

华为 芯片 校园招聘 国产替代 中芯国际

SQL FULL OUTER JOIN 关键字:左右表中所有记录的全连接解析

小万哥

MySQL 数据库 程序员 sql 后端开发

企业数字化浪潮来袭,华为云耀云服务器L实例打造中小企业

轶天下事

华为云助力中小企业应对挑战:云耀L实例在跨境电商的应用探析

轶天下事

你的编程能力从什么时候开始突飞猛进?

代码生成器研究

学习 编程 编程语言 可视化

在校大学生如何用编程赚钱?

代码生成器研究

教育行业内卷,技术降本增效是否去内卷化效应?

Speedoooo

小程序生态 降本增效 小程序容器 小程序技术 教育内卷

性能调优五步法

天翼云开发者社区

Linux 性能优化

Redis 慢操作

zurhan

华为云耀云服务器L实例助你轻松搭建个人网站

轶天下事

数字经济时代:城市到底如何演绎?产业将何去何从?

平平无奇爱好科技

Programming Abstractions in C阅读笔记:p197-p201

codists

Autoscaler 中 VPA 的设计与实现

Greptime 格睿科技

k8s 时序数据库

打造有效安全闭环,天翼云MDR来了!

天翼云开发者社区

云计算 网络安全

编程太难学?你可能还没试过这个神器

代码生成器研究

编程

CORS跨域问题

zurhan

Redis - AOF 日志

zurhan

数据同步:主从如何实现数据一致性

zurhan

轻松搭建,轻松上云——华为云耀云服务器L实例助力小程序开发

轶天下事

解锁 ElasticJob 云原生实践的难题

宋小生

竞放数字力量,释放无限潜能!

天翼云开发者社区

云计算 大数据 IDC

Python之父宣布退休;谷歌推出 TensorFlow企业版;OpenAI随时准备开源GPT-2完整代码 | AI一周资讯_AI&大模型_李冬梅_InfoQ精选文章