【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

Spark Summit EU 重头戏:TensorFlow、结构化的流和 GPU 硬件加速

  • 2016-11-22
  • 本文字数:843 字

    阅读完需:约 3 分钟

Spark Summit EU 2016 上星期在布鲁塞尔召开,其中大会中的重头戏是 Apache Spark 集成深度学习库 TensorFlow 、使用结构化的流进行在线学习和 GPU 硬件加速。

大会第一日最具特色的是预览了由 Spark 2.0 引入的一个创新。该 API 是针对 DataFrames 和 Datasets 简化了的接口,使其更容易去开发大数据应用。这个第二代的 Tungsten 引擎通过把 MPP 数据库的理念应用到数据处理查询使处理更接近于硬件了:针对中间数据和以节省空间的面向列方式保存在内存中的数据,生成的字节码充分利用 CPU 寄存器的能力。

不管 API 是否使用过,数据操作图都是通过 Catalyst Optimizer 优化过的,它针对所有集群上的计算指令生成执行计划,并针对每个操作进行优化。

结构化的流,这是作为阿尔法版针对流发布的一个新的高层API,在本次大会中也做了推介。该API 集成了Spark 的Dataset 和DataFrame,使开发人员可以以类似于Spark 批量API 的方式描述从(到)外部系统的数据读写。它通过以批处理指令的方式编译流处理指令提供了很强的一致性,并使事务型系统可以与存储系统集成在一起(比如HDFS 和AWS S3)。

在大会第二天,Databricks 的CEO Ali Ghodsi 将Spark 描绘成了将AI 大众化的一款工具,它简化了机器语言算法的数据准备和计算指令的管理。今年早些时候,深度学习类库TensorFlow 通过一个称为 TensorFrames 的类库集成运行于 Spark 之上。这个类库允许在 DataFrames 和 TensorFlow 之间在运行期传递数据。

数据科学专题召开了一个会议,主要围绕的主题是如何结构化流使机器学习具有弹性,并使其可以做到在线学习,这就有可能做到根据到达的数据去更新一些机器学习模型了,而不是采用一批离线任务去执行模型训练。

最后一个重头戏是在 Databricks 平台支持GPU 和更多深度学习类库集成的公告。GPU 的支持是通过像 CUDA 这样的硬件类库完成的,并可以在 Databricks 中预先构建它,据说这样集群设置成本就会有更低了。

查看英文原文: Spark Summit EU Highlights: TensorFlow, Structured Streaming and GPU Hardware Acceleration

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2016-11-22 18:001909

评论

发布
暂无评论
发现更多内容

区块链交易所开发|代码|证券市场|区块链技术

西安链酷科技

DAPP系统开发

芯片制造企业必备的7种项目管理系统

PingCode

项目管理 项目管理软件

MatrixOne Meetup回顾 | 上海站

MatrixOrigin

数据库 云原生 HTAP MatrixOrigin MatrixOne

按Value对Map进行排序,技术大佬们都在用这个方法

SoFlu软件机器人

国产大模型与国外技术的碰撞

百度开发者中心

大模型 ChatGPT 文心一言

大模型开发全流程解决方案

百度开发者中心

大模型 AIGC #人工智能

Topaz Video AI for mac(视频增强和修复软件) 4.0.1永久激活版

mac

苹果mac 视频增强修复软件 Windows软件 Topaz Video AI

浅析SpringBoot加载配置的6种方式 | 京东云技术团队

京东科技开发者

配置文件 spring-boot 企业号10月PK榜

实用的命令行终端增强软件:Tabby | 京东云技术团队

京东科技开发者

ios windows 终端工具 Tabby

亚马逊云科技生成式 AI 构建者大会精彩回顾

科技热闻

划词搜索IP插件

郑州埃文科技

集成业务计划IBP,实现企业最终愿景

智达方通

预算管理 集成业务计划

HDD上海站:HarmonyOS地图与位置服务,赋能开发者共促生态繁荣

新消费日报

TiDB x 汉口银行丨分布式数据库应用实践

编程猫

LP/DAPP代币合约流动性质押挖矿分红系统开发(逻辑及方案)丨LP/DAPP流动性挖矿源码

V\TG【ch3nguang】

PDF文件阅读和编辑软件 PDF Reader Pro

展初云

Mac PDF pdf阅读器 pdf编辑工具

从大模型到MaaS的新生态

百度开发者中心

大模型 AIGC #人工智能

命名虚拟机及设置安装路径怎么操作

小齐写代码

大模型问答助手前端实现打字机效果 | 京东云技术团队

京东科技开发者

前端 ChatGPT 企业号10月PK榜 流式回答

机器狗装上 ChatGPT 大脑当导游;AI 正在学习「超人的说服力」丨 RTE 开发者日报 Vol.73

声网

性能测试的实践痛点和解决方法

老张

性能测试 技术实践

国家数据局正式揭牌,隐私计算助力数据要素流通共享

郑州埃文科技

隐私计算

Networking with IPQ6018 IPQ6010 and IPQ4019|Elevating Industrial Connectivity: Upgrading from Wi-Fi 5 to Wi-Fi 6

wallyslilly

IPQ4019 IPQ6010 ipq6018

第6期 | 用友BIP项目云,为企业项目管理数智化而生

用友BIP

项目管理

Mac电脑UI/UX设计必备:Sketch 98.3中文激活版

胖墩儿不胖y

UI Mac软件 ui设计 矢量设计工具

数字先锋| 出版行业如何破圈出彩?“一朵云”让文化铸魂与数智发展并行!

天翼云开发者社区

云计算

大模型突现能力与范式转变

百度开发者中心

大模型 #人工智能 ChatGPT

GameFi游戏NFT链游开发系统搭建技术

西安链酷科技

区块链 dapp NFT 链游 ganfi

最详细的IntelliJ IDEA 2023.2.4 Mac安装与激活

晴雯哥

京东科技埋点数据治理和平台建设实践 | 京东云技术团队

京东科技开发者

数据埋点 平台建设 埋点治理 企业号10月PK榜

sip中继是什么意思

ctsxiyou

SIP sip中继

Spark Summit EU重头戏:TensorFlow、结构化的流和GPU硬件加速_大数据_Alexandre Rodrigues_InfoQ精选文章