大数据
讲述数据获取、存储、管理、分析的方方面面,关注软件、实践、生态,挖掘最新的前沿技术,同时也思考大数据与AI和云计算的深度结合。
- 全部
- DataOps
- 数据集成
- DataMesh
- 数据编织
- 数据湖仓
- 在离线混部
- 实时计算
- 其他
分布式 Data Warebase——探索数据系统物理极限 | QCon
了解数据领域最新发展趋势;如何借助新一代数据系统更好地提升业务价值;了解 AI 时代应当搭建什么样的数据底座
边缘上的关系型数据库:Cloudflare 如何运维分布式 PostgreSQL 集群
本文探索了 Cloudflare 的分布式 PostgreSQL 集群,学习跨区域架构如何确保韧性。
四个问题搞懂银行数据团队如何打造数据体系
数据团队就像是一个数据中台,能够全面贯穿整个组织的数据流。
蚂蚁安全领域智能化数据治理及新资产建设与探索|ArchSummit
人工智能的巨大突破对社会发展产生了重大的影响,使 AI 技术得以更普遍地下沉到更多的应用场景,AI 将驱动各行各业“质变”,高品质、多样性、大规模的智能数据集建设是 AI 技术应用竞争关键要素之一,在建设大规模数据集过程中,E 级别的安全数据资产必将带来高昂成本支出、及各种质量风险隐患,通过安全生产、表治理、存储与计算治理、平台治理、以及分级存储、智能调度等新技术手段降本增效,有效治理表量级 50%、存储与计算优化超 40%,年度节约成本近亿元。
钱大妈生鲜如何利用 CCR 实现 Apache Doris 集群读写分离
Apache Doris 跨集群复制(CCR) 功能的引入,为钱大妈带来了显著的收益。
数据传输效率实现百倍飞跃,Apache Doris 现已支持 Arrow Flight SQL 协议
为提供更高效的数据传输方案,Apache Doris 在 2.1 版本中基于 Arrow Flight SQL 协议实现了高速数据传输链路,使得数据传输性能实现百倍飞跃。
面向数据库的操作系统:80 岁的 PostgreSQL 之父宣布推出 DBOS Cloud
DBOS 的创建者最近推出了 DBOS Cloud,这是一个为 TypeScript 开发人员量身定制的事务性无服务器应用程序平台。
先定义什么不是数字化、坚信每个数据都有用、刻意不统一数据标准...... 凯士比转型中的“反骨”操作
技术不是为了革谁的命,而是真正为人服务。
小米下一代 Data AI 资产管理实践
7 个数据平台,1 套元数据体系,小米基于 Gravitino 的下一代资产管理实践
中小银行数据治理做不好,是问责机制和考评绩效体系的“锅”?
中小银行业务粗放发展所带来的数据质量差的问题,导致数据不能有效成为新生产要素发挥关键作用。
顶尖数据团队都是如何开展数据体系搭建工作的? | 《超级连麦. 数智大脑》
为了实现从数据采集、分析、到管理决策的全流程服务,让数据资源转变为数据资产,越来越多的企业加紧成立数据相关部门,希望实现对数据资产全生命周期的持续运营和价值挖掘。然而,对于国内很多非互联网企业而言,过去并未设立专门的数据团队,团队建设和管理具体如何展开?企业数据体系搭建工作又从哪些方面着手?如何让数据能够有效闭环到业务场景,为企业带来切实的商业价值?这一系列问题困扰着众多企业。
京东中台化底层支撑框架技术分析及随想
本文大约 1.7 万字,阅读需要 13 分钟。
中国信通院铸基计划年度大会成功举办,10+ 行业头部企业分享数字化转型实践
数字经济发展速度之快、辐射范围之广、影响程度之深前所未有。
云原生数据库下一站:像 MySQL 一样流行
随着数据的爆发式增长和业务多元化发展,传统集中式数据库已无法满足应用场景需求。
硬件成本降低 80%、OceanBase 在 58 同城的落地实践
因为业务种类繁多,很难找到一款数据库同时满足所有业务场景的要求,这是不少企业在数据库选型时的痛中之痛。
OceanBase 在网易游戏的技术实践
网易游戏引入 OceanBase 已近半年,总体表现非常稳定,未出现任何性能抖动和同步延迟问题,有效解决了业务痛点。
Apache Doris 如何基于自增列满足高效字典编码等典型场景需求
自增列的实现,使得 Apache Doris 可以在处理大规模时展示出更高的稳定性和可靠性。
兼容 Presto、Trino、ClickHouse、Hive 近 10 种 SQL 方言,Doris SQL Convertor 解读及实操
越来越多用户与企业开始将 Apache Doris 作为统一的数据分析产品,以解决多组件带来的数据冗余、架构复杂、分析时效性低、运维难度大等问题。
网易湖仓管理系统 Amoro 进入 Apache 孵化器
“让湖仓不再成为互联网企业的专宠。”
Databend x CubeFS:面向未来的企业级云原生数据存储与分析
用场景的丰富,企业面临着前所未有的数据存储挑战。大规模数据存储变得日常化,伴随着超大容量和快速变化的 I/O 需求,传统的存储解决方案已经难以满足企业对弹性、运维效率及总体拥有成本(TCO)的更高要求。这些挑战促使基于分布式架构的软件定义存储(SDS)
低代码编程语言 NASL 从设计到落地的闯关之路 | QCon
CodeWave 智能开发平台以 NASO 为核心编程语言,通过低代码开发、智能化设计和用户为中心的理念,致力于提供一种低门槛高上限的编程体验,同时通过自动化工具和嵌入式类型系统等方式解决了实现挑战,为用户提供了更便捷、高效的开发体验。NASO 的未来展望包括优化语言设计、支持专业程序员的需求、提高性能、支持中文化、推广标准化实施等方面,以及加速社区共建和开源化进程。
大模型落地到代码助手场景的探索实践 | QCon
涵盖了 AI 大模型在代码场景落地的探索实践,突出了模型的优势和挑战,以及团队在代码模型研发和应用方面的实践和思考。他的分享为 AI 时代下的新架构和产品经理的学习挑战提供了有益的思考和启发。
CDO 解决 ETL“不可能三角”的新思路:做“轻”数仓
反范式的 ETL 加工会导致数据仓库中的数据链条变得越来越长、越来越复杂
15 年云数据库老兵:数据库圈应告别“唯性能论”
最成功的数据库公司,不是靠性能快过竞争对手而成功。
数据平台竞技场 2024:AI 或成为必杀技,但面临三个致命挑战
以 Hadoop 为基础的大数据体系架构已逐步陈旧,新一代的分析平台以及更发挥 AI 能力的数据平台架构仍有非常多的疑问还没有得到解答。
究竟什么样的数据库,才能承接 RTA 广告这个技术活!
广告主企业往往每年需花费数亿甚至数十亿广告费,却依然难以准确触达目标用户,造成大量资金浪费。那该如何解决“让广告主对每一条广告请求,有投递或者拒绝的自主权”这一问题呢?
企业如何通过数据资产化,激活“数据要素 x”,乘出新质生产力
本文深入探讨数据要素与数据资产化的定义及其重要性,并在大数据背景下明确它们的关键角色。同时,梳理数据资产化的实现路径以及如何实现数据的应用价值,从而为企业在新时代的创新发展赋能,实现业务升级与价值跃迁。
ByConity 对象存储优化实践
数仓的存储标配。从成本考虑看,云上环境对象存储价格相对较低,交互方式标准,用户只需为实际使用的存储容量和请求来付费即可。
大模型场景应用遍地开花,但产品“王者”何时出现?| InfoQ 《极客有约》
主持人数势科技数据智能大模型产品总经理岑润哲同京东集团算法总监、京东零售数据与算法通道委员韩艾, 商汤 Copilot 产品负责人贾安亚,三合智能 COO 兼 产品研发负责人贾梓筠 博士共同探讨《大模型场景应用遍地开花,但产品“王者”何时出现?》在这个大模型时代,各种应用场景如雨后春笋般涌现,但究竟哪一款产品能够成为市场的“王者”,引领行业的发展方向呢?
2024 政府工作报告聚焦数字经济,“双象限”评选凸显数字化先锋
为推动行业数字化发展,识别数字化转型中的杰出企业,为各行业数字化转型提供趋势和标杆参考,中国信息通信研究院自 2022 年起持续发布《IOMM 企业数字化转型发展双象限》评选,即“转型者象限”和“赋能者象限”两大评选体系。