spark44

腾讯大数据宣布开源第三代高性能计算平台 Angel:支持十亿维度

12月18日,深圳-腾讯大数据宣布推出...Angel比Spark快数倍到数十倍,能在千万到十亿级的特征维度条件下运行。

在容器化环境中扩展分布式流式处理器
在容器化环境中扩展分布式流式处理器

本文介绍了我们在Kubernetes中扩展分布式流处理器的经验。流处理器应该支持维护最佳的并行性。...

知乎CTO李大海:知识内容平台 AI 技术应用思考
知乎 CTO 李大海:知识内容平台 AI 技术应用思考

随着移动互联网的发展,内容平台迎来了黄金时代。但也不可避免的,出现了很多问题和挑战。...

Strata AI 纽约大会热点回顾(一)

今年9月,由国际知名科技媒体集团O’Reilly举办的Artificial Intelligence研讨会,及Strata+Hadoop World ...

Uber机器学习平台Michelangelo是如何使用Spark模型的?
Uber 机器学习平台 Michelangelo 是如何使用 Spark 模型的?

Michelangelo是Uber的机器学习(ML)平台,可以训练并服务于整个公司范围内生产环境中的数千种模型。

Hadoop or TDengine,如何做物联网大数据平台的选型?
Hadoop or TDengine,如何做物联网大数据平台的选型?

本文介绍物联网大数据处理中可能遇到的问题,分析TDengine、InfluxDB、ClickHouse、Hadoop、MySQL等系统在...

Aurora, Mysql, Redshift 应用场景和成本分析
Aurora, Mysql, Redshift 应用场景和成本分析

Amazon Aurora 作为 AWS 增长最快的服务,已经在中国宁夏区域可用。

Python开发者年度调查报告出炉!Python3采用率超84%
Python 开发者年度调查报告出炉!Python3 采用率超 84%

2018 年球,Python软件基金会和著名IDE开发商JetBrains联合进行了第二届Python开发人员调查。