大数据

人人都在谈大数据,但理解其真谛的只是少数人。
收录了大数据话题下的 932 篇文章
  • 文章
  • 迷你书
混沌实践访谈:混沌工程和系统可观测性密不可分

在 O’Reilly 的一份新报告“Chaos Engineering Observability: Bringing Chaos Experiments into System Observability”中,Russ Miles 探究了为什么他认为可观测性和混沌工程这两个主题是“密切相关”的。

作者: Daniel Bryant 译者: 无明

2019 年 3 月 21 日
谷歌新研究对神经网络数据并行性提出质疑

歌的一项新研究表明,数据并行并不一定总能加快模型训练速度。这是为什么呢?

作者: 谷歌博客 译者: Debra

2019 年 3 月 20 日
数据中台已成下一风口,它会颠覆数据工程师的工作吗?

数据中台的出现会给现有数据从业者们带来颠覆式的挑战吗?

作者: 蔡芳芳

2019 年 3 月 19 日
Gartner 报告:我们正处于数据科学与机器学习工具 “大爆炸”的时代

近日,Gartner 发布了 2019 年版面向数据科学与机器学习工具的魔力象限。

作者: Alex Woodie 译者: 刘志勇

2019 年 3 月 19 日
3·15 曝光丨智能机器人一年拨打 40 亿个骚扰电话,6 亿人信息已遭泄露!

在昨晚的 315 晚会上,一条探针盒子 + 数据匹配 + 智能外呼机器人的灰色产业链遭到曝光。据报道,智能外呼机器人一年拨打电话可达 40 多亿个,探针盒子公司收集有全国 6 亿用户的各类信息!

作者: 小智

2019 年 3 月 16 日
将 PostgreSQL 数据库扩展到每个月 12 亿条记录的经验教训

选择在何处托管数据库、物化数据以及用数据库做工作队列。

作者:Gajus Kuizinas 译者: 姚佳灵

2019 年 3 月 15 日
Spark Streaming 作者,Alluxio 的创始人李浩源:AI 潮流对做数据存储业务公司的挑战

本文分享了李浩源博士对于大数据,对于 AI 带来的大数据的存储和计算问题,以及创业过程的理解。

作者: Robin.ly

2019 年 3 月 15 日
取代 ZooKeeper!高并发下的分布式一致性开源组件 StateSynchronizer

高并发 (>= 10000 clients) 场景下可以替代 ZooKeeper 和 etcd

作者: 蔡超前 滕昱

2019 年 3 月 14 日
OPPO 大数据平台运营研发实践分享

本文分享 OPPO 大数据平台规模极速增长历程中所做的一些工作,包括遇到的一些坑和收获的心得。

作者: DataFun社区

2019 年 3 月 14 日
爱奇艺大数据分析平台的演进之路

爱奇艺业务线达到 20 多条,存量的设备信息达到 30 亿,每天处理的用户行为日志超过 300T。这种业务数据量对数据运维、开发人员提出了很高的要求。

作者: DataFun社区

2019 年 3 月 13 日