收录了 数据湖技术架构 频道下的 50 篇内容
近几年,随着数据湖概念的兴起,业界对于数据仓库和数据湖的对比甚至争论始终不断。数据仓库和数据湖的区别到底是什么?本文作者来自阿里巴巴计算平台部门,在深度参与阿里巴巴大数据/数据中台领域建设之后,将对数据湖和数据仓库的来龙去脉进行深入剖析,阐述两者融合演进的新方向——湖仓一体。
2021年上半年,湖仓一体俨然已经成为大数据领域最火热的流行词,各大云厂商推出自己的湖仓一体产品,在众多产品中,企业如何找到符合自身需求的数据管理产品?
云原生数据湖致力于扩大公有云市场总量:一方面以低成本优势推动客户上云,另一方面云上客户得以低成本撬动更多结构化和非结构化数据的价值,是一场云厂商的自我革命。
“数据湖”作为近年来数据领域广泛热议的概念,其技术层面也受到了业界的广泛关注。数据湖不仅是一种集成和处理数据的极具前景的技术,更是一种治理数据的全新视角。
腾讯云发布云原生数据湖计算服务,协同腾讯云端数据湖体系,帮助企业高效构建云端数据湖架构、降低数据计算成本,提升数据分析敏捷性、激发数据应用价值,助力企业数字化决策。
从“智能湖仓”架构的技术演进,看现代化数据平台的发展方向。
生物本身就是算法,生命是不断处理数据的过程;意识与智能的分离;拥有大数据积累的外部环境将比我们自己更了解自己;
数据湖是一种越来越受欢迎的数据存储和分析方法,可解决处理海量异构数据的难题。云上数据湖解决方案的核心架构原则SSOT,即一份数据满足不同形态、不同引擎、不同大数据云产品的绝大部分大数据需求,无需数据移动、冗余,极大程度的降低用户云上存储成本。
数据湖的作用在未来肯定越来越重要。
随着数据湖相关技术的逐渐成熟、湖仓理论的发展,生产环境落地已经非常广泛。
本文回顾和分析了数据湖仓的历史和大数据平台的演进趋势,提出了基于增量计算的一体化趋势,以及该架构必然需要一个开放式的增量存储支撑。
本文将分享网易严选的数据湖建设过程和思考。
对话OPPO鲍永成:没有完备的数据体系,空谈湖仓之争没意义
湖仓一体架构力图结合数据仓库的弹性和数据湖的灵活性。本文介绍了由数据抽取、处理、编目和分析服务组成的概念架构,并给出了构建切实有效湖仓一体架构的五个基本原则。
聊聊大数据领域和数据仓库方向的技术演进
大数据存储已经走到了一个新的阶段,肯定会有新的革命性技术来替换它。
本文介绍数据湖特点、价值、架构及与其相关的概念。
现在看来,这些数据湖正在“走向失败”——也导致整个数据湖领域步步趋向“二次手术”。
数据中台也要从离线为主走向实时化,湖仓一体是第一步。
存储正在经历新一轮架构革命:戴尔科技集团在数据湖的探索和思考