【ArchSummit架构师峰会】基于大模型的基础框架、中台、应用层等专题全覆盖 >>> 了解详情
写点什么

大数据数仓

收录了 大数据数仓 频道下的 50 篇内容

爱奇艺数据中台建设组合拳:日志投递、统一数仓、大数据平台
爱奇艺数据中台建设组合拳:日志投递、统一数仓、大数据平台

本文介绍数据工作中最痛的八个点。

传统BI如何转大数据数仓
传统 BI 如何转大数据数仓

大家好,我是一哥,前几天建了一个数据仓库方向的小群,收集了大家的一些问题,其中有个问题,一哥很想去谈一谈——现在做传统数仓,如何快速转到大数据数据呢?其实一哥知道的很多同事都是从传统数据仓库转到大数据的,今天就结合身边的同事经历来一起分享一

大数据
BI
5月日更
如何搭建批流一体大数据分析架构?
如何搭建批流一体大数据分析架构?

当提到“实时分析”,大家脑海里首先浮现的是大屏上不断跳跃闪烁的数字和波动的曲线,让人有种纵观全局的掌控感。

4 亿用户过后,甜橙金融如何利用大数据和 AI 蓄力发展?

人工智能逐渐渗透进人们生活的方方面面,传统的工作领域也在被人工智能与大数据逐渐颠覆,金融就是其中的一个代表领域。在如今的金融领域,自助与自动化似乎都是常态,利用人脸识别进行身份验证,用户画像则用来对用户信用进行评级。在AI发展愈发强大的今天,金融领域还有哪些我们不知道的变化?这一切的背后又有什么样的技术在支撑?我们采访到了来自甜橙金融的大数据总监谢巍盛,这些问题将由他来进行一一解答。

从数仓到数据中台,谈技术选型最优解
从数仓到数据中台,谈技术选型最优解

本文介绍从数仓到数据中台的技术选型实践。

OPPO数仓与数据湖融合架构升级的实践与思考
OPPO 数仓与数据湖融合架构升级的实践与思考

对话OPPO鲍永成:没有完备的数据体系,空谈湖仓之争没意义

开源数据湖存储框架 Apache Hudi 如何玩转增量处理
开源数据湖存储框架 Apache Hudi 如何玩转增量处理

本文主要从 “增量处理”的角度切入来谈谈开源数据湖存储框架 Apache Hudi 对于数据湖的重要性。

Gartner 报告最新解读:数仓 or 数据湖?
Gartner 报告最新解读:数仓 or 数据湖?

本文对 Gartner 近期发布的“分析查询加速的市场引导报告(Market Guide for Analytics Query Accelerators)”进行解读。

打破数据孤岛,Apache Doris 助力纵腾集团快速构建流批一体数仓架构
打破数据孤岛,Apache Doris 助力纵腾集团快速构建流批一体数仓架构

早期基于多套 CDH 大数据架构,已无法满足当下数据分析需求。

万亿数据秒级响应,Apache Doris 在360数科实时数仓中的应用
万亿数据秒级响应,Apache Doris 在 360 数科实时数仓中的应用

随着金融科技业务的不断发展,对数据的安全性、准确性、实时性提出了更严格的要求。

一文解读分布式一致性协议Paxos
一文解读分布式一致性协议 Paxos

Paxos算法由Leslie Lamport在1990年提出,它是少数在工程实践中被证实的强一致性、高可用、去中心的分布式协议。

Apache Doris 在橙联的应用实践:数仓架构全面革新,千万数据计算时间从2小时变成3分钟
Apache Doris 在橙联的应用实践:数仓架构全面革新,千万数据计算时间从 2 小时变成 3 分钟

随着公司业务的发展和数据的不断增长,早期基于 MySQL 的传统数仓架构已经无法应对公司数据的快速增长。业务的需求和运营的决策对于数据时效性的要求越来越高,对数仓准实时能力的需求越发强烈。

Apache Doris在思必驰的应用优化实践:海量语音通话数据下,实时、离线一体的数仓架构设计实践
Apache Doris 在思必驰的应用优化实践:海量语音通话数据下,实时、离线一体的数仓架构设计实践

早期业务中,离线数据分析是我们的主要需求,近几年,随着业务的不断发展,业务场景对实时数据分析的要求也越来越高,早期数仓架构逐渐力不从心,暴露出很多问题。

网易严选质量数仓建设(一)—— 数据仓库基本概念
网易严选质量数仓建设(一)—— 数据仓库基本概念

对所有组织来说,数据都是重要的财富,数据的存在有两个目的:操作型记录的保存以及分析决策的制定。

爱奇艺大数据生态的实时化建设
爱奇艺大数据生态的实时化建设

数据作为互联网时代的基础生产资料,在各大公司企业拥有举足轻重的地位。

百亿大表 Join 提速 300倍!Apache Doris 在约苗数据平台的实时数仓建设实践
百亿大表 Join 提速 300 倍!Apache Doris 在约苗数据平台的实时数仓建设实践

为了满足要求,约苗的数据架构已经经历了三代演进。第一代架构基于 Elasticsearch,第二代架构引入了 ClickHouse,目前正在使用的是基于 Apache Doris 的第三代架构。

Kyligence发布下一代云原生数仓产品——智能数据云
Kyligence 发布下一代云原生数仓产品——智能数据云

大会在线上顺利举办。赋能等领域的成功经验。站等多个平台同步直播本次大会,吸引了上万的线上观众。界,上市首日,其市值即超700亿美金。

实时数仓、数据中台、大数据平台、湖仓一体各有什么区别?
实时数仓、数据中台、大数据平台、湖仓一体各有什么区别?

如果从一个初学者来说这些技术可能大家听起来会很容易觉得混淆,他们到底是什么样的一些关系?我为大家去简单的梳理一下。

数据中台
实时数仓在滴滴的落地实践
实时数仓在滴滴的落地实践

本文主要以顺风车这个业务为引子,从引擎侧、平台侧和业务侧各个不同方面,来阐述滴滴所做的工作,分享在建设过程中的经验。

大数据数仓专题_资料-InfoQ中文网