【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

Spark Summit EU 重头戏:TensorFlow、结构化的流和 GPU 硬件加速

  • 2016-11-22
  • 本文字数:843 字

    阅读完需:约 3 分钟

Spark Summit EU 2016 上星期在布鲁塞尔召开,其中大会中的重头戏是 Apache Spark 集成深度学习库 TensorFlow 、使用结构化的流进行在线学习和 GPU 硬件加速。

大会第一日最具特色的是预览了由 Spark 2.0 引入的一个创新。该 API 是针对 DataFrames 和 Datasets 简化了的接口,使其更容易去开发大数据应用。这个第二代的 Tungsten 引擎通过把 MPP 数据库的理念应用到数据处理查询使处理更接近于硬件了:针对中间数据和以节省空间的面向列方式保存在内存中的数据,生成的字节码充分利用 CPU 寄存器的能力。

不管 API 是否使用过,数据操作图都是通过 Catalyst Optimizer 优化过的,它针对所有集群上的计算指令生成执行计划,并针对每个操作进行优化。

结构化的流,这是作为阿尔法版针对流发布的一个新的高层API,在本次大会中也做了推介。该API 集成了Spark 的Dataset 和DataFrame,使开发人员可以以类似于Spark 批量API 的方式描述从(到)外部系统的数据读写。它通过以批处理指令的方式编译流处理指令提供了很强的一致性,并使事务型系统可以与存储系统集成在一起(比如HDFS 和AWS S3)。

在大会第二天,Databricks 的CEO Ali Ghodsi 将Spark 描绘成了将AI 大众化的一款工具,它简化了机器语言算法的数据准备和计算指令的管理。今年早些时候,深度学习类库TensorFlow 通过一个称为 TensorFrames 的类库集成运行于 Spark 之上。这个类库允许在 DataFrames 和 TensorFlow 之间在运行期传递数据。

数据科学专题召开了一个会议,主要围绕的主题是如何结构化流使机器学习具有弹性,并使其可以做到在线学习,这就有可能做到根据到达的数据去更新一些机器学习模型了,而不是采用一批离线任务去执行模型训练。

最后一个重头戏是在 Databricks 平台支持GPU 和更多深度学习类库集成的公告。GPU 的支持是通过像 CUDA 这样的硬件类库完成的,并可以在 Databricks 中预先构建它,据说这样集群设置成本就会有更低了。

查看英文原文: Spark Summit EU Highlights: TensorFlow, Structured Streaming and GPU Hardware Acceleration

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2016-11-22 18:001911

评论

发布
暂无评论
发现更多内容

产品开发的工具分析

执于业务

产品经理 需求

"数字货币市场回归价值导向:Somle预售事件的启示"

区块链软件开发推广运营

区块链浏览器 dapp开发 链游开发 NFT开发 公链开发

2024-03-23:用go语言,一张桌子上总共有 n 个硬币 栈 。每个栈有 正整数 个带面值的硬币, 每一次操作中,你可以从任意一个栈的 顶部 取出 1 个硬币,从栈中移除它,并放入你的钱包里。

福大大架构师每日一题

福大大架构师每日一题

Ubuntu系统内核更新与卸载

百度搜索:蓝易云

云计算 Linux ubuntu 运维 云服务器

农业物联网的3大系统、4大功能、对应的模式

执于业务

LED显示屏:体育馆的现代科技之光

Dylan

LED显示屏 全彩LED显示屏 led显示屏厂家 体育

0元克隆自己的数字人形象!

青否数字人

数字人

公链系统开发全指南:从规划到实施,详解每个步骤

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

Wicrypt:赋有激励的 DePIN 互联网共享生态

股市老人

关于 .NET Core 中的 Host

雄鹿 @

ASP.NET Core

纠个错……OpenAI和马斯克的两个开源项目都叫Grok?

天马行空的大杂烩

程序员 开源项目 马斯克

【分布式技术】分布式协议和算法

L L

分布式技术 分布式算法 Java 技术栈

去中心化交易所搭建|区块链数字货币交易平台开发

西安链酷科技

去中心化交易所系统开发 dex交易所开发

产品经理常用的6个画原型需求工具

执于业务

数字人小语种主播进行跨境直播带货!

青否数字人

数字人

区块链公链技术开发

西安链酷科技

GameFi游戏NFT链游开发系统搭建技术

西安链酷科技

链游开发 区块链游戏开发

Penpad 生态资产 $PDD LaunchPad 在即,Season 2 规则解读

西柚子

Flannel dial tcp X.X.X.X i/o timeout报错解决

百度搜索:蓝易云

云计算 Linux 运维 云服务器 ECS

https比http安全在哪

百度搜索:蓝易云

Linux 运维 https HTTP ssl

《自动机理论、语言和计算导论》阅读笔记:p1-p4

codists

自动机

DeFi/DAPP 质押挖矿系统技术开发

西安链酷科技

云算力挖矿源码 dap质押挖矿开发 云算力挖矿

DAPP钱包燃烧质押合约挖矿项目系统开发

l8l259l3365

交互数字人直播,一对一回复顾客问题!

青否数字人

数字人

定制Dapp开发:快速上线您的去中心化应用

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

【redis问题】Caused by: io.netty.channel

百度搜索:蓝易云

redis 云计算 Linux 运维 云服务器

Scala并发编程的react、loop方法详解

百度搜索:蓝易云

云计算 Linux 运维 React 云服务器

构建多语言数字资产交易平台和秒合约系统:从概念到实现

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 公链开发 FT开发

Segment Anything(SAM)的哪些后续方法,又快又好?

AI帅辉

深度学习 计算机视觉 图像分割

初级Go工程师训练营第0期总结

刘博

Go 极客时间 课程总结

动力底盘域的“一小步”,智能汽车的“一大步”

脑极体

AI

Spark Summit EU重头戏:TensorFlow、结构化的流和GPU硬件加速_大数据_Alexandre Rodrigues_InfoQ精选文章