大数据

关注
收录了大数据频道下的 3070 篇内容
大数据无论在现在还是未来,都是企业和技术人关注的焦点。讲述获取、存储、管理、分析的方方面面,关注软件、实践、生态,挖掘最新的前沿技术,同时也思考大数据与AI和云计算的深度结合。
  • 全部
  • 文章
  • 视频
  • 话题
  • 电子书
告别传统金融消息架构:Apache Pulsar 在平安证券的实践
告别传统金融消息架构:Apache Pulsar 在平安证券的实践

本文介绍了平安证券的 Apache Pulsar 实践。

5年迭代5次,抖音推荐特征系统演进历程
5 年迭代 5 次,抖音推荐特征系统演进历程

结合 Flink SQL 和 Flink 有状态计算能力,我们正在构建下一代通用的基础特征计算统一架构

从NoSQL到Lakehouse,Apache Doris的13年技术演进之路
从 NoSQL 到 Lakehouse,Apache Doris 的 13 年技术演进之路

从 2008 年第一个版本开始到今天,Apache Doris 已经走过了 13 个年头。

10月不能错过的这场开源大数据大会,有哪些亮点值得开发者关注?
10 月不能错过的这场开源大数据大会,有哪些亮点值得开发者关注?

这里既有对开源大数据技术和工具发展趋势的解读,也有如何基于开源项目构建企业级数据平台的探讨和交流。

StreamNative宣布2300万美元A轮融资,将推动整合数据湖技术
StreamNative 宣布 2300 万美元 A 轮融资,将推动整合数据湖技术

本轮融资主要用于产品研发和团队人才招聘,增强 StreamNative 在消息、流存储和流处理技术方向的投入,加快产品服务迭代优化和客户增长。

Python 登顶 TIOBE 结束多年霸榜,新版本发布带来多项功能更新
Python 登顶 TIOBE 结束多年霸榜,新版本发布带来多项功能更新

Python 编程语言成功以 11.27% 的评级登上 TIOBE 10 月榜一,结束了 Java 和 C 的多年霸榜时代,成为 20 多年来新的语言霸主。

Uber如何处理和使用乘客数据改善App的体验?
Uber 如何处理和使用乘客数据改善 App 的体验?

数据是实现这种发展的最基本工具。本文将聚焦乘客数据:我们如何收集和处理以及这些数据具体如何影响了乘客端 App 的改进。

从入职到放弃再到改革成功:我是如何从0到1建立数据团队的?
从入职到放弃再到改革成功:我是如何从 0 到 1 建立数据团队的?

这篇文章所提及的故事背景是在一家处于创业中期阶段的初创企业(年收入约 1000 万美元)组建了一支小型数据团队(大约 4 人),尽管这个故事可能发生在很多不同的公司。

Hadoop 生态里,为什么 Hive 活下来了?
Hadoop 生态里,为什么 Hive 活下来了?

Apache Hive 能在下一轮“淘汰”中幸存下来吗?

漫谈云网络的十年“修路”历程 | InfoQ 大咖说
漫谈云网络的十年“修路”历程 | InfoQ 大咖说

作为现代 IT 基础设施中最重要的组件之一,云网络可能是很多人的“知识盲区”。本次大咖说,我们连线阿里巴巴集团研究员 祝顺民(花名江鹤),带你看尽云网络的前世今生。

Ballerina Swan Lake:10个令人瞩目的云原生编程语言特性
Ballerina Swan Lake:10 个令人瞩目的云原生编程语言特性

从 2019 年 1.0 版本发布以来,Ballerina 语言已经取得了长足的发展。最新的 Swan Lake 版本进一步简化了云原生应用的构建和部署。

成功从 Hadoop 迁移到 Lakehouse 架构的 5 个关键步骤
成功从 Hadoop 迁移到 Lakehouse 架构的 5 个关键步骤

从 Hadoop 迁移到基于云的现代架构(比如 Lakehouse 架构)的决定是业务决策,而非技术决策。我们在之前的文章中探讨了每一个组织都必须重新评估他们与 Hadoop 的关系的原因。本文中,我们将特别关注实际的迁移过程本身。你将学习成功迁移的关键步骤,以及 Lakehouse 架构在激发下一轮数据驱动创新中所扮演的角色。

架构师(2021年10月)架构师(2021年10月)
架构师(2021 年 10 月)

本期推荐内容:放弃坚持 15 年的原生开发,1Password 用 Electron 重写了全部代码;Docker 员工自述:我们为什么“输”给了 Kubernetes?Istio 在百度百亿级流量生产环境的研发实践

DTDS 全球数字人才发展峰会 | 线上峰会「直播回放」
DTDS 全球数字人才发展峰会 | 线上峰会「直播回放」

9 月 23 日 ,极客时间企业版 和 环球人力资源智库联合发起 DTDS 全球数字人才发展在线峰会,帮助处在转型中或想要转型的企业提供人才培养的参考视角,通过数字化人才的培育提升数字化能力,打造企业数字化人才梯队,共同助力企业实现战略愿景。

开天、盘古、全球一张网,探秘华为云的技术底气
开天、盘古、全球一张网,探秘华为云的技术底气

是什么样的技术战略,让华为云“悄咪咪”的就成了“全球五朵云”之一呢?

为什么说数据管理的下一步是DataOps
为什么说数据管理的下一步是 DataOps

云原生产品的标准化程度比较高,这样容易做出标准化的产品让大家使用。

将Flink融合进消息系统,RocketMQ为什么选择了与Kafka不一样的路
将 Flink 融合进消息系统,RocketMQ 为什么选择了与 Kafka 不一样的路

RocketMQ 集成了 Flink 功能,消息系统和计算引擎的融合带来的两大好处

数据准备:让ETL敏捷起来
数据准备:让 ETL 敏捷起来

调查显示,数据分析师通常会将 60% 以上的时间花在数据清洗和各种数据整理上,真正用来探索数据,获取业务洞察的时间反而有限,工作效率亟待提高。

Uber如何为近实时特性构建可伸缩流管道?
Uber 如何为近实时特性构建可伸缩流管道?

本文中,我们将以生产需求和供应特征为例,介绍我们所面临的一些挑战以及如何应对这些挑战。尤其要说明的是,如何使用性能调整框架来优化实时管道。

数字化转型,你真的认真想了吗?
数字化转型,你真的认真想了吗?

写代码的你,需要关心的数字化转型问题

  • 用户头像
    关注

    InfoQ编辑

  • 用户头像
    关注

    InfoQ高级编辑

  • 用户头像
    关注

    InfoQ高级编辑

    从 1 到 100:混沌工程实践的可视化与平台化
    从 1 到 100:混沌工程实践的可视化与平台化

    黄帅 | 亚马逊 专业服务部资深云架构顾问

    立即下载
    基于 TensorFlow 2 的 AI 项目如何快速落地?

    彭靖田 | Google Developers Experts 《TensorFlow 快速入门与实战》作者

    立即下载
    基于 Serverless 重塑前端应用研发模式

    刘雄(大果) | 阿里巴巴 淘系技术部 高级前端技术专家

    立即下载