写点什么

Spark Summit EU 重头戏:TensorFlow、结构化的流和 GPU 硬件加速

  • 2016-11-22
  • 本文字数:843 字

    阅读完需:约 3 分钟

Spark Summit EU 2016 上星期在布鲁塞尔召开,其中大会中的重头戏是 Apache Spark 集成深度学习库 TensorFlow 、使用结构化的流进行在线学习和 GPU 硬件加速。

大会第一日最具特色的是预览了由 Spark 2.0 引入的一个创新。该 API 是针对 DataFrames 和 Datasets 简化了的接口,使其更容易去开发大数据应用。这个第二代的 Tungsten 引擎通过把 MPP 数据库的理念应用到数据处理查询使处理更接近于硬件了:针对中间数据和以节省空间的面向列方式保存在内存中的数据,生成的字节码充分利用 CPU 寄存器的能力。

不管 API 是否使用过,数据操作图都是通过 Catalyst Optimizer 优化过的,它针对所有集群上的计算指令生成执行计划,并针对每个操作进行优化。

结构化的流,这是作为阿尔法版针对流发布的一个新的高层API,在本次大会中也做了推介。该API 集成了Spark 的Dataset 和DataFrame,使开发人员可以以类似于Spark 批量API 的方式描述从(到)外部系统的数据读写。它通过以批处理指令的方式编译流处理指令提供了很强的一致性,并使事务型系统可以与存储系统集成在一起(比如HDFS 和AWS S3)。

在大会第二天,Databricks 的CEO Ali Ghodsi 将Spark 描绘成了将AI 大众化的一款工具,它简化了机器语言算法的数据准备和计算指令的管理。今年早些时候,深度学习类库TensorFlow 通过一个称为 TensorFrames 的类库集成运行于 Spark 之上。这个类库允许在 DataFrames 和 TensorFlow 之间在运行期传递数据。

数据科学专题召开了一个会议,主要围绕的主题是如何结构化流使机器学习具有弹性,并使其可以做到在线学习,这就有可能做到根据到达的数据去更新一些机器学习模型了,而不是采用一批离线任务去执行模型训练。

最后一个重头戏是在 Databricks 平台支持GPU 和更多深度学习类库集成的公告。GPU 的支持是通过像 CUDA 这样的硬件类库完成的,并可以在 Databricks 中预先构建它,据说这样集群设置成本就会有更低了。

查看英文原文: Spark Summit EU Highlights: TensorFlow, Structured Streaming and GPU Hardware Acceleration

2016-11-22 18:002492

评论

发布
暂无评论
发现更多内容

西格电力绿电直连架构选型指南,如何实现效益最大化?

西格电力

绿色低碳 新能源 绿色经济 绿电直连 可再生能源发电

八千字 《宠知汇》HarmonyOS应用案例热点技术解析

万少

鸿蒙

有哪些能一键生成PPT的AI软件?8个PPT生成器大盘点!

职场工具箱

效率 PPT AI软件 AI工具 AI生成PPT

过程控制 软件维护经验总结(4)

万里无云万里天

工业 工厂运维 过程控制

司马阅与麦腾科创达成生态战略合作,构建AI驱动的园区运营体系

司马阅

过程控制 软件维护经验总结(5)

万里无云万里天

工业 工厂运维 过程控制

垂直领域海外红人营销的策略差异与红人画像

Wolink

跨境电商 海外社媒营销 海外营销推广 达人营销

不止新生代与老年代:深入Java虚拟机堆内存布局与TLAB、卡表等优化机制

poemyang

垃圾回收 Java虚拟机

库拉岗日雪山:读懂美的AI版图

脑极体

AI

综合治理系统

深圳亥时科技

四川银行 X腾讯云:超5000节点TencentOS部署、支撑93套应用系统

极客天地

写给创业者新手:什么是MAU指标,什么是ARR、PMF

Y11

创业 求职 找工作

低代码代码生成实操:发布后二次开发全流程,预览 / 对比 / 命名规范一次搞懂

引迈信息

探讨超长上下文推理的潜力

Baihai IDP

AI LLM 超长上下文推理

React中useContext的基本使用和原理解析

老李说技术

React useContext React Hooks

大模型应用开发技术路线(上):从概念到RAG实战,这套方法论让我从0到1落地企业级AI应用

六边形架构

人工智能 知识库平台 RAG技术

社区伙伴活动推荐 | 2025年声纹处理研究与应用学术研讨会11月深圳启幕

RTE开发者社区

秘鲁LED广告屏价格分析:从预算到选型

Dylan

广告 广告业 LED LED display LED屏幕

海外红人营销常见陷阱:看看踩坑了没?

Wolink

跨境电商 海外社媒营销 海外营销推广 品牌出海 海外红人营销

NocoBase 2.0:与你的 AI 员工见面

NocoBase

人工智能 开源 低代码 无代码 版本更新

伟创力发布《2025可持续发展报告》

财见

数字孪生项目开发流程

北京木奇移动技术有限公司

数字孪生 软件外包公司 webgl开发

押注AI、发力UGC,微博能否摆脱“中年危机”?

趣解商业

互联网 微博

AI时代的新SEO玩法:使用SERP API构建排名追踪系统

不叫猫先生

AI SEO SERP API #AI 代理 AEO

数字孪生项目的开发框架

北京木奇移动技术有限公司

数字孪生 软件外包公司 webgl开发

一款基于 .NET WinForm 开源、轻量且功能强大的节点编辑器,采用纯 GDI+ 绘制无任何依赖库仅仅100+Kb

追逐时光者

C# .net WinForm

绿电直连为何必须配储能?—— 储能的战略定位与系统价值

西格电力

高性能存储 #高性能存储 储能 能源转型 绿色能源转型

Abaqus企业版&教育版的区别-达索Dassault Systèmes正版软件代理商

思茂信息

仿真 abaqus 达索

提示词工程-VB Coding-标准化探索

Jxin

AI 研发管理平台 提示词工程 氛围编程 VB

数字孪生在绿电直连中的 4 大应用场景与 ROI 测算

西格电力

数字孪生 新能源行业 电力系统 绿电直连 可再生能源发电

AI HR全球化创新实践案例特辑即将发布:10+龙头企业案例、5大AI转型思路

财见

Spark Summit EU重头戏:TensorFlow、结构化的流和GPU硬件加速_大数据_Alexandre Rodrigues_InfoQ精选文章