spark44

腾讯大数据宣布开源第三代高性能计算平台 Angel:支持十亿维度

12月18日,深圳-腾讯大数据宣布推出...Angel比Spark快数倍到数十倍,能在千万到十亿级的特征维度条件下运行。

作者: Tina

Scala 在挖财的应用实践

这次分享有三个方面,1是介绍一下挖财当年的开发情况和后端的架构,2是挖财选择Scala的原因,3是挖财使用...

作者: 王宏江

2015 年 12 月 29 日
Airflow成为Apache软件基金会的顶级项目
Airflow 成为 Apache 软件基金会的顶级项目

Airflow是一个开源的大数据工作流管理系统,在Adobe、Airbnb、Etsy、谷歌、ING、Lyft、PayPal、Reddit、...

作者: Apache软件基金会 译者: 姚佳灵

2019 年 1 月 14 日
Python开发者年度调查报告出炉!Python3采用率超84%
Python 开发者年度调查报告出炉!Python3 采用率超 84%

2018 年球,Python软件基金会和著名IDE开发商JetBrains联合进行了第二届Python开发人员调查。

作者: Python软件基金会 译者: Debra

2019 年 2 月 27 日
每秒上百万次的跨数据中心写操作?Uber 是如何使用 Mesos 和 Cassandra 来处理的

本文简单介绍了Uber解决跨数据中心每秒上百万次写操作的系统架构及一些参数,并分享了一些数据。

作者: highscalability

2016 年 12 月 21 日
体系化认识 RPC

RPC(Remote Procedure Call),即远程过程调用,是一个分布式系统间通信的必备技术,本文体系性地介绍了 ...

作者: 张旭

2017 年 10 月 24 日
数据科学技能中,哪些是核心技能,哪些是热门 / 新兴技能?
数据科学技能中,哪些是核心技能,哪些是热门 / 新兴技能?

大家最希望添加或提升的技能是机器学习(41%)和 Python(37%)。

作者: Gregory Piatetsky 译者: 刘志勇

势高,则围广:TiDB 的架构演进哲学
势高,则围广:TiDB 的架构演进哲学

一上来就是先做最难最有挑战的具有最高 QPS 和 TPS、最大数据量的场景,这就是一个「取势」的思路,因为「...

作者: 刘奇

2019 年 6 月 3 日