大数据

人人都在谈大数据,但理解其真谛的只是少数人。
收录了大数据频道下的 1467 篇内容
  • 文章
  • 迷你书
360大数据中心总监徐皓:如何制定可奏效的数据安全体系
360 大数据中心总监徐皓:如何制定可奏效的数据安全体系

在万物互联的大数据时代,数据安全是个不容忽视的大问题。但企业往往缺乏未雨绸缪的意识,直到数据泄露等事件发生时才亡羊补牢,因此造成不可逆的损失和影响。

搜索引擎中的 web 数据挖掘
搜索引擎中的 web 数据挖掘

本文介绍全网搜索引擎中的数据挖掘系统的设计方案与核心算法。

沃尔玛架构翻新:如何保证微服务领域的业务连续性和灾难恢复
沃尔玛架构翻新:如何保证微服务领域的业务连续性和灾难恢复

为了支持如此大的规模,我们决定对这套产品进行现代化改造和架构翻新。同时,有一项关键要求是保持业务的连续性。系统中的任何生产问题都会影响全球各地的客户。这套系统 " 不能 " 在 " 保证的时间表 " 之外的时间下线。

同为工业界最大的推荐业务场景,快手短视频推荐与淘宝推荐有何不同?
同为工业界最大的推荐业务场景,快手短视频推荐与淘宝推荐有何不同?

快手短视频推荐在技术实现上有什么独特的难点?未来推荐技术领域还有哪些重要的技术趋势和方向值得关注?让我们来一探究竟。

Facebook分布式队列系统Scribe:支持百万机器、PB/h级传输
Facebook 分布式队列系统 Scribe:支持百万机器、PB/h 级传输

Scribe 处理日志时的输入速率可以超过 2.5TB/s,输出速率可以超过 7TB/s。作为参考,我们可以看下欧洲核子研究中心的大型强子对撞机,它在最近这次运行期间的输出速率估计只有每秒 25GB。

数学vs编程,哪个才是数据科学的敲门砖?
数学 vs 编程,哪个才是数据科学的敲门砖?

入门数据科学,这个问题要先想清楚。

UMStor Hadapter - 大数据与对象存储的柳暗花明
UMStor Hadapter - 大数据与对象存储的柳暗花明

但凡是千禧年之前出生的国人,心里大体都有一个武侠情结,那是一个由金庸、古龙的一本本武侠小说以及港台武侠剧堆砌出来的武林世界。

从0到1搭建360金融大数据风控系统:AI做了什么?
从 0 到 1 搭建 360 金融大数据风控系统:AI 做了什么?

对于互联网金融行业并不算新鲜的大数据风控这件事儿,为什么 360 金融的做法可圈可点?AI 在其中做了什么?

Flink 流式计算在节省资源方面的简单分析
Flink 流式计算在节省资源方面的简单分析

小米在流式计算方面经历了 Storm、Spark Streaming 和 Flink 的发展历程。在整个发展历程中,逐步完善了稳定性、作业管理、日志和监控收集展示等关系到用户易用性和运维能力的特性,帮助越来越多的业务接入到了 Flink。

我们是如何做到在6个月内将成本降低30%、流量增加25%?
我们是如何做到在 6 个月内将成本降低 30%、流量增加 25%?

我们在六个月中(当年 7 月到次年 1 月)努力将基础设施成本降低了 30%,同一时期流量则增长了 25%。