NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

AI 周报:Tumblr 用户控诉 TensorFlow 不如 PyTorch;2019 全球 AI 报告:每天 2 亿美元投入 AI 领域,1/10 砸向自动驾驶;纽约大学开发出 BLiMP,可测试 BERT 和 GPT-2 等语言模型

  • 2019-12-15
  • 本文字数:3780 字

    阅读完需:约 12 分钟

 AI周报:Tumblr 用户控诉TensorFlow不如PyTorch;2019全球AI报告:每天2亿美元投入AI领域,1/10砸向自动驾驶;纽约大学开发出BLiMP,可测试BERT和GPT-2等语言模型

资讯

Tumblr 用户控诉 TensorFlow“太糟糕”,认为 PyTorch 更好用

近日,一位 Tumblr 用户控诉谷歌的TensorFlow有点让人摸不着头脑,用起来也有不够顺手。他在发文中提到,TensorFlow 的代码有点冗杂,但是谷歌依然不断地为软件发布新特性,最终导致软件更加难于理解和使用。


开发者列出了 TensorFlow 一系列使用缺陷,“知道它在某些方面让我想起了什么吗?在出现大量向后不兼容新特性后,好不容易刚刚掌握了特定平台的相关知识后,这种知识又将在两年内被淘汰,这的确会让人沮丧,”Tumblr 这样用户写道。



随着人工智能逐渐步入工业化阶段,越来越多人将使用软件来开发人工智能,而能吸引最多开发者的软件将可能成为类似Linux这样的新计算实现的基础。所以,人们对 TensorFlow 的抱怨与对PyTorch的欣赏就形成了鲜明的对比。Facebook开发的 PyTorch 人工智能软件框架显然要比 TensorFlow 更容易使用,也更加灵活。

纽约大学研究员开发出 BLiMP,用于测试 BERT 和 GPT-2 等语言模型

过去几年,像BERTGPT-2这样的大型语言模型颠覆了自然语言处理的研究,在短时间内取得了巨大突破。目前,纽约大学研究员开发了一款能帮助人们更容易对比不同模型性能的 benchmark,这款 benchmark 可以比较出不同模型的优缺点,同时还能将语言模型与人类表现进行对比。



该 benchmark 被称为 BLiMP,是“语言最小对立组 benchmark”的缩写。BLiMP 测试了语言模型如何根据不同的标准对不同的句子进行分类,测试涉及了 12 种语言现象,包括省略、主谓一致、不规则形式等。BLiMP 也提供了人类基准线,帮助我们根据绝对得分和相对表现来比较语言模型。BLiMP 完整数据集由 67 个分类(1000 个句子对)组成,每个分类属于 12 种语言现象中的一种。


“我们评估的所有模型都远低于人类的表现”,研究人员这样写道。“GPT-2 表现最好,在某些语法现象上和人类表现平分秋色(甚至几乎超越人类),但是整体表现比人类低 8%。”需要注意的是,作者仅测试了中型版本的 GPT2(对比 7.75 亿参数的大版本和 15 亿参数的 XL 超大版本来说,3.45 亿的版本就是中型版本),所以姑且可以认为其他版本的性能会更好一些。通过对比发现,Transformer-XL、LSTM 和 5-gram 表现更差。


他们写道,BLiMP 可以“作为作为 benchmark 对新语言模型的总体表现进行评估”。此外,由于 BLiMP 测试可以适用于不同的语言现象中,因此可利用它详细对比不同模型之间的差异和优劣。

2019 年 ACM Fellow 公布:阿里平头哥首席科学家谢源等 7 位华人当选

纽约时间 12 月 11 日,美国计算机学会(ACM)宣布 2019 年新当选 ACM Fellow 名单,共有 58 位科学家当选,其中包括有阿里平头哥首席科学家、达摩院高级研究员谢源在内的 7 位华人学者。这 7 位华人学者分别是陈熙霖、李向阳、吕松武、陶大程、谢源、周礼栋、Dawn Song,来自人脸识别、物联网、蜂窝网络、分布式计算、安全和隐私等不同研究领域。ACM Fellow 用于表彰在计算机和信息技术领域从业五年以上,并做出”突出贡献“(Exceptional Contributions)的科学家,只有 1% 的 ACM 会员有机会当选。



ACM 创立于 1947 年,目前在全世界 130 多个国家和地区拥有超过 10 万名会员,是世界上最大的教育和科学计算机协会,其所评选的图灵奖被誉为”计算机界的诺贝尔奖“。ACM Fellow 计划于 1993 年启动,旨在表彰计算领域领先成员的杰出贡献,截止目前已有 1000 多位 ACM Fellow 诞生。本次选出的 58 名 ACM Fellow 分别来自澳大利亚、加拿大、中国、埃及、法国、德国、以色列、意大利、瑞士和美国的大学、公司和研究中心。

谷歌助理现能在智能手机上翻译 44 种语言

在今年一月的拉斯维加斯消费电子展期间,谷歌首次推出了“口译员模式”,这是一种实时翻译功能,适用于 Google Home 扬声器和第三方智能显示器(例如索尼,LG 和联想)。当时,这家科技巨头表示,解释器模式最终会出现在移动设备上。



该功能于 12 月 13 日正式上线。自 13 日一早开始,Android 和 iOS 智能手机上的 Google Assistant 都支持口译员模式,用户可以通过它询问路线、点菜或用外语聊天等。其可以识别的语言数量从之前的 27 种增加到了 44 种,包括希腊语、土耳其语和汉语等。并且现在在解释器模式下,用户可以选择使用键盘输入文字或手动选择他们要说的语言。

微软首款 Office 应用程序登陆 Linux

今年 9 月时,微软曾确认正在为 Linux 构建 Teams 客户端。时隔两个多月,微软在官方博客中宣布 Microsoft Teams 已在 Linux 上公开预览,并可下载使用,该本地软件包有 .deb 和 .rpm 两种格式以供选择。



Microsoft Teams 客户端是微软引入 Linux 的首款 Office 365 应用程序,它是一款集成的办公软件,提供即时聊天、视频会议、文件共享等功能,使团队能够轻松协作。Teams 是微软有史以来增长最快的业务应用,根据微软上个月公布的数据,该应用每天有 2000 万活跃用户。


微软承诺,此次的 Linux 版本也将同样支持 Teams 的所有核心功能。不过它现在仍处于公开预览状态,也就意味着部分功能可能暂时无法使用或无法正常工作。微软工作人员告诉外媒 VentureBeat:“会议中有一些与 Office 应用和屏幕共享/控制相关的功能,在 Linux 中尚不可用”。同时微软也表示将根据社区的反馈进一步做出改进,期待用户下载并提交使用反馈。

《斯坦福 2019 全球 AI 报告》:每天 2 亿美元投入 AI 领域,1/10 砸向自动驾驶

由斯坦福大学发起的人工智能指数(AI Index)是一个追踪 AI 动态和进展的非营利性项目,旨在全面研究 AI 行业状况,目标是促进基于数据的 AI 的广泛交流和有效对话。12 月 12 日,AI Index 发布了 2019 年度报告。《报告》显示,2019 年,全球私有 AI 投资超过 700 亿美元,相当于每天 2 亿多美元砸向 AI 领域。此外,自动驾驶汽车在过去一年中获得了全球投资的最大份额(77 亿美元),其次是 AI 医疗(47 亿美元)、面部识别(47 亿美元)、视频内容(36 亿美元)和欺诈检测和金融(31 亿美元)。


量子计算机实用重要里程碑!英特尔发布首款低温控制芯片 Horse Ridge

英特尔研究院发布了代号为“Horse Ridge”的首款低温控制芯片,以加快全栈量子计算系统的开发步伐。作为量子实用性道路上的一个重要里程碑, Horse Ridge 实现了对多个量子位的控制,并为向更大的系统扩展指明了方向。


基于英特尔 22 纳米 FinFET 技术,英特尔与 QuTech(由荷兰代尔夫特理工大学与荷兰国家应用科学院联合创立)共同开发了 Horse Ridge。控制芯片的制造在英特尔内部完成,将极大地提高英特尔在设计、测试和优化商业上可行的量子计算机的能力。



英特尔量子硬件总监 Jim Clarke 表示:“虽然人们非常重视量子位本身,但同时控制多个量子位仍是业界的一大挑战。英特尔认识到,量子控制是大规模商用量子系统开发过程中的核心环节,这也是英特尔投资量子纠错和控制技术的原因。通过Horse Ridge,英特尔开发了一个可扩展的控制系统,能够大大加快测试速度并实现量子计算的潜力。”

谷歌推出改进版文本分类和模型训练的 AutoML 自然语言

今年早些时候,谷歌完成了其 AutoML 自然语言的收尾工作,这是其 Cloud AutoML 机器学习平台向自然语言处理领域的扩展。经过长达一个月的测试后,AutoML 自 12 月 13 日起开始向全球客户开放,支持分类、情感分析和实体提取等任务,以及一系列文件格式—包括本机和扫描的 PDF。



AutoML 自然语言可以利用机器学习来揭示电子邮件、聊天记录、社交媒体帖子等中文本的结构和含义。它可以从上传和粘贴的文本或谷歌云盘文档中提取有关人员、地点和事件的信息,并且允许用户训练自己的自定义 AI 模型来分类,检测和分析诸如情感,实体,内容和句法等。此外,它还提供自定义实体提取功能。

声音

软银中国华平:围绕 AI 智能化、医疗健康、新材料进行投资

在第十九届中国股权投资年度论坛上,软银中国资本管理合伙人华平表示,软银中国仍将主要围绕科技型企业投资,他提到三大领域:AI 智能化、医疗健康、新材料。关于 AI 智能化,华平认为,虽然大家在这方面已经讲了很长时间,但从概念到真正改变行业,实际上还是刚刚开始。同时,ToB 也一直是软银中国在投资上大的方向。未来,“还会持续在这里面再加码”。



软银中国资本管理合伙人华平


从宏观角度来看,华平认为,围绕科技创新的投资一定会升温,在行业所占的比重会越来越大。同时他指出,有两方面因素会推动这种变化到来。首先,是中美之间贸易的讨论。这意味着国内一定会培养很多的高科技企业,形成拥有自己丰富核心技术的产业链;再者,科创板到目前为止健康运营,已经上市几十家公司,可以缩短投资科技型企业的退出周期,也会让大家更愿意去投资科技型企业。

AI 开源工具

Multi Model Server

Multi Model Server(MMS)是一个灵活且易于使用、用任何 ML/DL 框架都可进行深度学习模型训练的工具。使用 MMS Server CLI 或预配置 Docker 图像来设置 HTTP 端点来处理模型推理请求。



https://github.com/awslabs/multi-model-server


ergo


ergo 是从拉丁语“我思故我在 Cogito ergo sum”中而来,这是一款能让 Keras 机器学习更加简单的命令行工具。它可以:


· 用最少数量的代码在数秒内构建新项目;


· 编码样本、导入和优化 CSV 数据集并且用这些来训练模型;


· 在训练中可视化模型结构、损失和精准函数;


· 借助差分推理决定每个输入特征如何影响精准度;


· 从服务器导出一个简单的 REST API 来使用模型。


https://github.com/evilsocket/ergo


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-12-15 14:003293

评论

发布
暂无评论
发现更多内容

PHP通过Redis解决并发请求的操作问题

百度搜索:蓝易云

php redis 云计算 Linux 云服务器

OSPF的基本概念

百度搜索:蓝易云

云计算 Linux 运维 OSPF 云服务器

智慧医院解决方案

菜根老谭

智慧医院

一次故障演练,十分钟自动搞定?

华为云开发者联盟

运维 华为云 企业号2024年4月PK榜 华为云开发和联盟

魔搭×函数计算:实现大模型快速部署,加速AI应用落地

百度开发者中心

人工智能 大模型

✅为什么MySQL默认使用RR隔离级别?

派大星

MySQL Java 面试题

大模型下B端前端代码辅助生成的思考与实践 | 得物技术

得物技术

JavaScript AI web前端 ChatGPT 企业号 4 月 PK 榜

Penpad获Gate Labs以及Scroll联创Sandy的投资

西柚子

Appium控件交互策略:优化自动化测试效率的关键方法

霍格沃兹测试开发学社

物资管理的挑战与机遇:利用技术提升效率与可持续性

天津汇柏科技有限公司

详解数仓的向量化执行引擎

华为云开发者联盟

数据库 华为云 华为云开发者联盟 华为云GaussDB(DWS) 企业号2024年4月PK榜

国产化替代进程中金融行业的中间件

Onegun

信创 国产化

如何延长LED显示屏的使用寿命

Dylan

环境 角色 LED显示屏 全彩LED显示屏 led显示屏厂家

大模型Chatbots评估新视角:结合定性与程序方法的实践探索

百度开发者中心

人工智能 大模型

重回铁王座!时隔5年!Quill 2.0 终于发布啦🎉

Kagol

前端 富文本编辑器

凭证管理揭秘:Cookie-Session 与 JWT 方案的对决

Phoenix

安全架构 会话管理

捷途山海T2携手坦克300 Hi4-T上市,消费者该如何选择?

Geek_2d6073

企业为什么需要MES,万界星空科技MES系统的解决方案

万界星空科技

数字化转型 工业互联网 制造业 mes 万界星空科技

一文了解AI长文本工具:马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!

蓉蓉

openai

全媒体信息流广告正规渠道代理商-互联网线上广告加盟商利润全给

互联网创业说

Appium控件互动攻略:提升自动化测试效率的必备方法大揭秘!

测试人

软件测试 自动化测试 测试开发

php报错:Malformed UTF-8 characters, possibly incorrectly encoded

百度搜索:蓝易云

php 云计算 Linux 云服务器

搭载联想小天个人智能体的AI PC亮相 PC从此变CP

科技热闻

火山引擎ByteHouse:OLAP如何支持超高QPS点查?

字节跳动数据平台

大数据 企业号2024年4月PK榜

AI数字人直播带货会被抖音封号吗?

青否数字人

数字人

腾讯社交广告代理招商 微信朋友圈广告代理 一站式售后扶持

互联网广告践行者

OpenHarmony NAPI开发 主讲人:连志安

Laval小助手

全媒体信息流广告投放代理权 微信朋友圈广告投放代理​‌‌互联网信息流广告代理权

微点全媒体微信推广渠道

IPQ5018 vs. IPQ5010 How to choose for Router and Mesh Applications?

wallyslilly

ipq5018

百度沈抖:智能,生成无限可能

百度Geek说

AI 百度智能云 企业号 4 月 PK 榜

观测云产品更新 | 管理、容器、异常追踪、场景图表、DQL等

观测云

监控

 AI周报:Tumblr 用户控诉TensorFlow不如PyTorch;2019全球AI报告:每天2亿美元投入AI领域,1/10砸向自动驾驶;纽约大学开发出BLiMP,可测试BERT和GPT-2等语言模型_语言 & 开发_李冬梅_InfoQ精选文章