Spark

收录了Spark频道下的 123 篇内容
  • 全部
  • 文章
  • 迷你书
估值62亿美元,Databricks会成为企业AI平台的黑马吗?
估值 62 亿美元,Databricks 会成为企业 AI 平台的黑马吗?

Ali Ghodsi:“这是我经历过的最容易的一次融资”。

Spark诞生头十年:Hadoop由盛转衰,统一数据分析大行其道
Spark 诞生头十年:Hadoop 由盛转衰,统一数据分析大行其道

2019 年是 Spark 诞生的第 10 个年头,统一数据分析的理念始终植根于 Spark 的各个发展阶段。

Spark Streaming源码分析:DStream的内置和运行
Spark Streaming 源码分析:DStream 的内置和运行

本文介绍 Spark-Streaming 的流处理模型,DStream 的内部实现以及其如何构建和运行。

架构师(2019年12月)
架构师(2019 年 12 月)

本期主要内容:真正支配世界的十种算法;敏捷中国十八年目睹之怪现状;混沌工程落地的六个阶段

迁移了几十家企业之后,我们总结了如何在云中构建成功的现代数据分析平台
迁移了几十家企业之后,我们总结了如何在云中构建成功的现代数据分析平台

这样一套强大的数据平台已经成为企业所不可或缺的数字化与 AI 转型基础。

由Decimal操作计算引发的Spark数据丢失问题
由 Decimal 操作计算引发的 Spark 数据丢失问题

本文介绍一次数据质量相关的问题以及排查该问题的过程和解决方案。

Apache Spark 3.0 预览版正式发布,多项重大功能发布
Apache Spark 3.0 预览版正式发布,多项重大功能发布

Apache Spark 3.0 增加了很多令人兴奋的新特性

Apache Arrow Flight:快速数据传输框架
Apache Arrow Flight:快速数据传输框架

这是一个新的通用客户端服务器框架,用于简化大型数据集通过网络接口的高性能传输。

我用Rust徒手重写了一个Spark,并把它开源了
我用 Rust 徒手重写了一个 Spark,并把它开源了

运行快 3 倍、内存利用率仅 1/30,终极目标:替代 Spark

Uber机器学习平台Michelangelo是如何使用Spark模型的?
Uber 机器学习平台 Michelangelo 是如何使用 Spark 模型的?

Michelangelo 是 Uber 的机器学习(ML)平台,可以训练并服务于整个公司范围内生产环境中的数千种模型。