NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

AI 周报:Tumblr 用户控诉 TensorFlow 不如 PyTorch;2019 全球 AI 报告:每天 2 亿美元投入 AI 领域,1/10 砸向自动驾驶;纽约大学开发出 BLiMP,可测试 BERT 和 GPT-2 等语言模型

  • 2019-12-15
  • 本文字数:3780 字

    阅读完需:约 12 分钟

 AI周报:Tumblr 用户控诉TensorFlow不如PyTorch;2019全球AI报告:每天2亿美元投入AI领域,1/10砸向自动驾驶;纽约大学开发出BLiMP,可测试BERT和GPT-2等语言模型

资讯

Tumblr 用户控诉 TensorFlow“太糟糕”,认为 PyTorch 更好用

近日,一位 Tumblr 用户控诉谷歌的TensorFlow有点让人摸不着头脑,用起来也有不够顺手。他在发文中提到,TensorFlow 的代码有点冗杂,但是谷歌依然不断地为软件发布新特性,最终导致软件更加难于理解和使用。


开发者列出了 TensorFlow 一系列使用缺陷,“知道它在某些方面让我想起了什么吗?在出现大量向后不兼容新特性后,好不容易刚刚掌握了特定平台的相关知识后,这种知识又将在两年内被淘汰,这的确会让人沮丧,”Tumblr 这样用户写道。



随着人工智能逐渐步入工业化阶段,越来越多人将使用软件来开发人工智能,而能吸引最多开发者的软件将可能成为类似Linux这样的新计算实现的基础。所以,人们对 TensorFlow 的抱怨与对PyTorch的欣赏就形成了鲜明的对比。Facebook开发的 PyTorch 人工智能软件框架显然要比 TensorFlow 更容易使用,也更加灵活。

纽约大学研究员开发出 BLiMP,用于测试 BERT 和 GPT-2 等语言模型

过去几年,像BERTGPT-2这样的大型语言模型颠覆了自然语言处理的研究,在短时间内取得了巨大突破。目前,纽约大学研究员开发了一款能帮助人们更容易对比不同模型性能的 benchmark,这款 benchmark 可以比较出不同模型的优缺点,同时还能将语言模型与人类表现进行对比。



该 benchmark 被称为 BLiMP,是“语言最小对立组 benchmark”的缩写。BLiMP 测试了语言模型如何根据不同的标准对不同的句子进行分类,测试涉及了 12 种语言现象,包括省略、主谓一致、不规则形式等。BLiMP 也提供了人类基准线,帮助我们根据绝对得分和相对表现来比较语言模型。BLiMP 完整数据集由 67 个分类(1000 个句子对)组成,每个分类属于 12 种语言现象中的一种。


“我们评估的所有模型都远低于人类的表现”,研究人员这样写道。“GPT-2 表现最好,在某些语法现象上和人类表现平分秋色(甚至几乎超越人类),但是整体表现比人类低 8%。”需要注意的是,作者仅测试了中型版本的 GPT2(对比 7.75 亿参数的大版本和 15 亿参数的 XL 超大版本来说,3.45 亿的版本就是中型版本),所以姑且可以认为其他版本的性能会更好一些。通过对比发现,Transformer-XL、LSTM 和 5-gram 表现更差。


他们写道,BLiMP 可以“作为作为 benchmark 对新语言模型的总体表现进行评估”。此外,由于 BLiMP 测试可以适用于不同的语言现象中,因此可利用它详细对比不同模型之间的差异和优劣。

2019 年 ACM Fellow 公布:阿里平头哥首席科学家谢源等 7 位华人当选

纽约时间 12 月 11 日,美国计算机学会(ACM)宣布 2019 年新当选 ACM Fellow 名单,共有 58 位科学家当选,其中包括有阿里平头哥首席科学家、达摩院高级研究员谢源在内的 7 位华人学者。这 7 位华人学者分别是陈熙霖、李向阳、吕松武、陶大程、谢源、周礼栋、Dawn Song,来自人脸识别、物联网、蜂窝网络、分布式计算、安全和隐私等不同研究领域。ACM Fellow 用于表彰在计算机和信息技术领域从业五年以上,并做出”突出贡献“(Exceptional Contributions)的科学家,只有 1% 的 ACM 会员有机会当选。



ACM 创立于 1947 年,目前在全世界 130 多个国家和地区拥有超过 10 万名会员,是世界上最大的教育和科学计算机协会,其所评选的图灵奖被誉为”计算机界的诺贝尔奖“。ACM Fellow 计划于 1993 年启动,旨在表彰计算领域领先成员的杰出贡献,截止目前已有 1000 多位 ACM Fellow 诞生。本次选出的 58 名 ACM Fellow 分别来自澳大利亚、加拿大、中国、埃及、法国、德国、以色列、意大利、瑞士和美国的大学、公司和研究中心。

谷歌助理现能在智能手机上翻译 44 种语言

在今年一月的拉斯维加斯消费电子展期间,谷歌首次推出了“口译员模式”,这是一种实时翻译功能,适用于 Google Home 扬声器和第三方智能显示器(例如索尼,LG 和联想)。当时,这家科技巨头表示,解释器模式最终会出现在移动设备上。



该功能于 12 月 13 日正式上线。自 13 日一早开始,Android 和 iOS 智能手机上的 Google Assistant 都支持口译员模式,用户可以通过它询问路线、点菜或用外语聊天等。其可以识别的语言数量从之前的 27 种增加到了 44 种,包括希腊语、土耳其语和汉语等。并且现在在解释器模式下,用户可以选择使用键盘输入文字或手动选择他们要说的语言。

微软首款 Office 应用程序登陆 Linux

今年 9 月时,微软曾确认正在为 Linux 构建 Teams 客户端。时隔两个多月,微软在官方博客中宣布 Microsoft Teams 已在 Linux 上公开预览,并可下载使用,该本地软件包有 .deb 和 .rpm 两种格式以供选择。



Microsoft Teams 客户端是微软引入 Linux 的首款 Office 365 应用程序,它是一款集成的办公软件,提供即时聊天、视频会议、文件共享等功能,使团队能够轻松协作。Teams 是微软有史以来增长最快的业务应用,根据微软上个月公布的数据,该应用每天有 2000 万活跃用户。


微软承诺,此次的 Linux 版本也将同样支持 Teams 的所有核心功能。不过它现在仍处于公开预览状态,也就意味着部分功能可能暂时无法使用或无法正常工作。微软工作人员告诉外媒 VentureBeat:“会议中有一些与 Office 应用和屏幕共享/控制相关的功能,在 Linux 中尚不可用”。同时微软也表示将根据社区的反馈进一步做出改进,期待用户下载并提交使用反馈。

《斯坦福 2019 全球 AI 报告》:每天 2 亿美元投入 AI 领域,1/10 砸向自动驾驶

由斯坦福大学发起的人工智能指数(AI Index)是一个追踪 AI 动态和进展的非营利性项目,旨在全面研究 AI 行业状况,目标是促进基于数据的 AI 的广泛交流和有效对话。12 月 12 日,AI Index 发布了 2019 年度报告。《报告》显示,2019 年,全球私有 AI 投资超过 700 亿美元,相当于每天 2 亿多美元砸向 AI 领域。此外,自动驾驶汽车在过去一年中获得了全球投资的最大份额(77 亿美元),其次是 AI 医疗(47 亿美元)、面部识别(47 亿美元)、视频内容(36 亿美元)和欺诈检测和金融(31 亿美元)。


量子计算机实用重要里程碑!英特尔发布首款低温控制芯片 Horse Ridge

英特尔研究院发布了代号为“Horse Ridge”的首款低温控制芯片,以加快全栈量子计算系统的开发步伐。作为量子实用性道路上的一个重要里程碑, Horse Ridge 实现了对多个量子位的控制,并为向更大的系统扩展指明了方向。


基于英特尔 22 纳米 FinFET 技术,英特尔与 QuTech(由荷兰代尔夫特理工大学与荷兰国家应用科学院联合创立)共同开发了 Horse Ridge。控制芯片的制造在英特尔内部完成,将极大地提高英特尔在设计、测试和优化商业上可行的量子计算机的能力。



英特尔量子硬件总监 Jim Clarke 表示:“虽然人们非常重视量子位本身,但同时控制多个量子位仍是业界的一大挑战。英特尔认识到,量子控制是大规模商用量子系统开发过程中的核心环节,这也是英特尔投资量子纠错和控制技术的原因。通过Horse Ridge,英特尔开发了一个可扩展的控制系统,能够大大加快测试速度并实现量子计算的潜力。”

谷歌推出改进版文本分类和模型训练的 AutoML 自然语言

今年早些时候,谷歌完成了其 AutoML 自然语言的收尾工作,这是其 Cloud AutoML 机器学习平台向自然语言处理领域的扩展。经过长达一个月的测试后,AutoML 自 12 月 13 日起开始向全球客户开放,支持分类、情感分析和实体提取等任务,以及一系列文件格式—包括本机和扫描的 PDF。



AutoML 自然语言可以利用机器学习来揭示电子邮件、聊天记录、社交媒体帖子等中文本的结构和含义。它可以从上传和粘贴的文本或谷歌云盘文档中提取有关人员、地点和事件的信息,并且允许用户训练自己的自定义 AI 模型来分类,检测和分析诸如情感,实体,内容和句法等。此外,它还提供自定义实体提取功能。

声音

软银中国华平:围绕 AI 智能化、医疗健康、新材料进行投资

在第十九届中国股权投资年度论坛上,软银中国资本管理合伙人华平表示,软银中国仍将主要围绕科技型企业投资,他提到三大领域:AI 智能化、医疗健康、新材料。关于 AI 智能化,华平认为,虽然大家在这方面已经讲了很长时间,但从概念到真正改变行业,实际上还是刚刚开始。同时,ToB 也一直是软银中国在投资上大的方向。未来,“还会持续在这里面再加码”。



软银中国资本管理合伙人华平


从宏观角度来看,华平认为,围绕科技创新的投资一定会升温,在行业所占的比重会越来越大。同时他指出,有两方面因素会推动这种变化到来。首先,是中美之间贸易的讨论。这意味着国内一定会培养很多的高科技企业,形成拥有自己丰富核心技术的产业链;再者,科创板到目前为止健康运营,已经上市几十家公司,可以缩短投资科技型企业的退出周期,也会让大家更愿意去投资科技型企业。

AI 开源工具

Multi Model Server

Multi Model Server(MMS)是一个灵活且易于使用、用任何 ML/DL 框架都可进行深度学习模型训练的工具。使用 MMS Server CLI 或预配置 Docker 图像来设置 HTTP 端点来处理模型推理请求。



https://github.com/awslabs/multi-model-server


ergo


ergo 是从拉丁语“我思故我在 Cogito ergo sum”中而来,这是一款能让 Keras 机器学习更加简单的命令行工具。它可以:


· 用最少数量的代码在数秒内构建新项目;


· 编码样本、导入和优化 CSV 数据集并且用这些来训练模型;


· 在训练中可视化模型结构、损失和精准函数;


· 借助差分推理决定每个输入特征如何影响精准度;


· 从服务器导出一个简单的 REST API 来使用模型。


https://github.com/evilsocket/ergo


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-12-15 14:003290

评论

发布
暂无评论
发现更多内容

从智能汽车到智慧出行,区块链能打通车联网的任督二脉吗?

CECBC

五步实现HarmonyOS应用(ets)【鸿蒙开发 07】

坚果

鸿蒙 1月月更

微信的业务架构图和学生管理系统的毕业设计

Geek_8d5fe5

架构实战营

恒源云(GPUSHARE)_AdderSR: Towards Energy Efficient Image Super-Resolution学习笔记

恒源云

人工智能 深度学习 计算机视觉

手把手教你丨小熊派移植华为 LiteOS-M

华为云开发者联盟

华为 鸿蒙 LiteOS 小熊派 移植

恒源云(GPUSHARE)_attention decoder效果不佳时如何应对

恒源云

深度学习 计算机视觉

SparkSQL的入门实践教程

华为云开发者联盟

sql spark 编程 Sparksql 结构化数据

基于Calcite的分布式多数据源查询

麒思妙想

MySQL 数据库 Apache Calcite gbase8a

企业上云后,不容忽视的管理工具-云管平台

行云管家

云计算 企业上云 云管平台 云管理

Flutter启动流程分析之插件化升级探索

得物技术

flutter Weex Google 框架 原生

Linux之wc命令

入门小站

Linux

一款基于Java语言开发的,开源商业应用的模块化开发框架和智能管理平台-Axelor

马农驾驾驾

Java 系统开发 BPM 开发框架 智能管理

直播回顾:准确性提升到 5 秒级,ssar 独创的 load5s 指标有多硬核?| 龙蜥技术

OpenAnolis小助手

Linux 开源

前端工程师 2022 年必备的 7 个工具

开源之巅

JavaScript node.js

2022年保障企业内网安全就用行云管家!免费试用!

行云管家

云计算 云平台 内网 云管平台

用 docker 快速搭建 kafka(qbit)

qbit

kafka zookeeper docker image

“以终为始”的正确使用方式

石云升

思维模型 1月月更

异步调用如何使用是最好的方式?

CRMEB

全栈工程师?你知道全流程工程师吗?

蜜糖的代码注释

Java 开发 后端技术

高并发环境下,6个构建缓存服务需要注意的问题

华为云开发者联盟

缓存 高并发 开发 并发 缓存服务

第三方测评:GaussDB(for Redis)稳定性与扩容表现

华为云开发者联盟

redis 华为云 GaussDB(for Redis) NoSQL数据库 云原生NoSQL数据库

☕【Java深层系列】「并发编程系列」让我们一起探索一下CompletionService的技术原理和使用指南

洛神灬殇

Java 线程池 CompletionService 异步执行 1月日更

必读!如何有效的进行沟通

观测观测

在线YAML转TOML工具

入门小站

工具

“在线设计”网络资源管理的源头活水

鲸品堂

通信运营商 在线设计平台

鉴释加入龙蜥社区,助力开源生态建设

OpenAnolis小助手

Linux 开源 社群 合作伙伴

携程DBA负责人俞榕刚:OceanBase在携程的落地和实践

OceanBase 数据库

数据库 分布式 OceanBase 开源 携程 客户实践

流批一体技术框架探索及在袋鼠云数栈中的实践

袋鼠云数栈

鉴释加入龙蜥社区,助力开源生态建设

OpenAnolis小助手

Linux 开源

来自未来的交互设计!当电影中的一切变为现实,设计师要如何进化?

博文视点Broadview

农业掀起“上链”潮 区块链等数字技术正成为乡村振兴新动力

CECBC

 AI周报:Tumblr 用户控诉TensorFlow不如PyTorch;2019全球AI报告:每天2亿美元投入AI领域,1/10砸向自动驾驶;纽约大学开发出BLiMP,可测试BERT和GPT-2等语言模型_语言 & 开发_李冬梅_InfoQ精选文章