大数据
讲述数据获取、存储、管理、分析的方方面面,关注软件、实践、生态,挖掘最新的前沿技术,同时也思考大数据与AI和云计算的深度结合。
- 全部
- DataOps
- 数据集成
- DataMesh
- 数据编织
- 数据湖仓
- 在离线混部
- 实时计算
- 其他

Uber 的混合云数据:工程师如何攻破解大规模复制难题
Uber 工程团队对其数据复制平台做了全面升级,现在每天可以在混合云和本地数据湖之间移动数以 PB 计的数据,解决了由于工作负载迅速增长而引起的扩展挑战。

GlassFish 8.0 发布,兼容 Jakarta EE 11,增强安全性并改进数据访问
经过 15 个里程碑版本的迭代,Eclipse 基金会正式发布了 GlassFish 8.0,带来了对虚拟线程的支持、增强的应用安全能力以及改进的数据访问功能。GlassFish 8.0 是 Jakarta EE 11 的兼容实现。Java Champion、OmniFish 联合创始人 Ondro Mihályi 就 GlassFish 8.0 接受了 InfoQ 的采访。

Pinterest 基于 CDC 的摄取系统将数据库延迟从 24 小时缩短至 15 分钟
Pinterest 推出了新一代数据库摄取框架,旨在突破传统批处理系统的局限性,提升实时数据的可用性。

Databricks 推出面向 AI 工作负载的 PostgreSQL 数据库 Lakebase
最近,Databricks 正式发布 Lakebase。这是一个基于 PostgreSQL 的无服务器 OLTP 数据库,能够独立扩展计算和存储。它旨在与 Databricks 平台集成,提供一种综合事务与分析能力的混合解决方案。

凭借全新数据原生开发工具,在 Snowflake 中更快地将创意投入生产 | 技术趋势
通过一系列的创新,Snowflake 帮助开发者摆脱在零散工具和窗口之间频繁切换的负担,真正把精力集中在创造价值上,不断拓展现代应用开发的边界,迈向由智能体驱动的 AI。

Snowflake 将 AI 就绪的企业数据置于您的指尖 |技术趋势
Snowflake 最新的平台增强能力覆盖事务处理、分析、自动化优化、互操作性以及企业级数据治理与韧性,本篇博客将有助于您深入了解 Snowflake 如何将数据、AI 与行动紧密衔接。

AI 在生命科学领域 2026 年发展展望 |技术趋势
随着 2026 年到来,生命科学整个行业都站在关键转折点上。在监管变化、经济压力和预算约束持续叠加的背景下,制药与医疗器械企业正将 AI 与数据民主化纳入核心战略,通过提升效率、推动创新、重构运营流程,加速药物研发与商业化落地。

关于采用 Snowflake Internal Marketplace 的最佳实践 |技术实践
Snowflake Internal Marketplace 能够极大简化数据产品与人工智能资产在企业内部的共享、治理、发现与使用流程。本文档结合实践经验,总结出一套适用于组织成功部署 Internal Marketplace 平台的最佳实践方案。

从表格到网络:图分析智能体如何重构工业决策体系 | 技术实践
为释放真正的运营韧性与效能,工业界正超越传统商业智能,转向能够理解互连关系的自主系统——图分析智能体。通过运用 Neo4j Snowflake 原生应用程序中的强大算法,这些智能体能够大规模分析复杂网络,将原始连接数据转化为主动的工业运营决策。


金融数据库国产实践:从能用到好用,腾讯云 TDSQL 成功案例精选
本白皮书共汇集了 14 个金融领域典型实践案例,覆盖了多个金融核心场景,便于你“找同类”—— 城商行、股份制银行、农信体系、保险、券商等不同主体,对稳定性、并发特征、迁移窗口与治理能力的要求并不相同。本案例集以多类型机构呈现差异化路径,你无需担心被单一“最优解”误导。

我们是否应该取消 BI 报告,追求对话式分析? | 技术趋势
在医疗健康领域,传统 BI 并未被取代,而是正在演进为一项融合描述性分析、预测性分析与交互式迭代探索的动态学科。

Snowflake Cortex Code:它是什么,为什么重要,以及何时使用它 |技术实践
Snowflake 正式发布 Cortex Code ——一款原生集成于 Snowflake 的 AI 编程助手,旨在显著缩短从构想到生产上线的周期,尤其适用于依赖受管企业数据的开发场景。

Dropbox 如何构建可扩展的企业知识搜索上下文引擎
Dropbox 工程师详细介绍了其团队如何搭建 Dropbox Dash 背后的上下文引擎,展示了从传统方案向基于索引的检索、知识图谱派生上下文以及持续评估机制的演进。

现代化 ML 技术栈:智能体、多模态与实时工作流正式发布 | 技术趋势
传统机器学习在当今人工智能领域依然至关重要,其作为预测洞察的核心驱动力,支撑着从供应链优化到实时欺诈检测等关键业务价值的实现。然而,从实验到生产部署的路径依然充满挑战:各生态系统工具碎片化,需要复杂的配置流程、多轮优化迭代以及持续的运维投入。 Snowflake 始终致力于打造现代化的机器学习平台,该平台与您的数据深度集成,提供统一的安全保障,并通过可弹性扩展的工作流加速业务价值实现。

一文读懂 Snowflake:7 个 AI 与语义层的关键策略要点 | 技术实践
本文围绕 Snowflake 平台语境,提出 7 项利用语义层实现 AI 就绪的战略建议。

宝马、Indeed 和 WHOOP 的降本增效实践:如何在 Lakehouse 上构建分析与 AI 能力 | 技术实践
本期博客将重点展示三大品牌——BMW Group、Indeed 与 WHOOP,如何在其全域数据资产中驱动分析与人工智能应用,从而将开放数据架构转化为可量化的商业成果。

Snowflake 语义视图自动驾驶:分钟级 AI 驱动的语义建模 | 技术趋势
具备治理性、可信语义的数据层已成为 AI 就绪数据的基础能力。近日,Snowflake 正式宣布语义视图自动驾驶(Semantic View Autopilot,SVA) 全面上市。该系统能够基于现有查询与商业智能资产,自动生成语义视图。
![[Tech Blog]OpenClaw引爆Agent生态,数据可信成为关键命题](https://static001.infoq.cn/resource/image/c1/40/c1dd4ae17888a6e4ce299bb5fea8fa40.png?x-oss-process=image/crop,x_325,y_183,w_651,h_366/resize,w_416,h_234)
[Tech Blog]OpenClaw 引爆 Agent 生态,数据可信成为关键命题
2026 年都到 2 月了,如果你还没有听说过火出圈的 OpenClaw,你可能有点 OUT 了。框架,已经从技术社区彻底破圈,变成现象级开源 AI 智能体(Agent)——GitHub 星标超 18.6 万、Discord 社区成员破 10 万,短短几个月,它已经成为云服务商、企业数据中心、AI 工程团队竞相布局的热门方向。

如何利用 Snowflake 将 AI 创新转化为可靠、生产就绪的应用 | 技术趋势
Snowflake 最新的产品创新赋予客户基于 Snowflake 平台构建可靠、企业级应用的能力。这将带来更高效的执行、更简化的运维流程,以及企业可放心投入生产环境的人工智能工具。

OpenEverest:开源数据库自动化平台
近日,Percona 宣布推出 OpenEverest,这是一个支持多种数据库技术的开源平台,用于自动化数据库配置和管理。

预防数据泄露:在 GCP 上实施 VPC 服务控制的实践
本文分享了在 Google Cloud Platform (GCP) 环境中实施 VPC-SC 以防止数据窃取的经验教训,重点关注设计决策、分阶段实施、监控和持续改进。

谷歌推出托管 AlloyDB 连接池
谷歌云正式发布 AlloyDB for PostgreSQL 通用托管连接池,将类似 PgBouncer 的功能直接集成到数据库服务中。

Andy Pavlo:数据库年度回顾
数据库是大生意。让我们逐一了解下。

别再手动拼凑 Data Pipeline 了!这个新平台想让你彻底告别 Iceberg 运维噩梦
Etleap 发布全新的 Iceberg Pipeline 托管平台,通过集成摄取、转换与运维,助力企业在 VPC 环境内低成本构建高效数据湖仓。

AI 驱动的大数据自治:TCInsight 智能应对复杂运维挑战
在大数据平台高速发展的当下,生态扩张与业务量激增,致使大数据分布式组件问题愈发棘手,传统专家运维模式捉襟见肘。以腾讯大数据庞大的规模为例,面对海量计算单元、繁杂技术栈以及千万级任务管理,借助 AI 驱动实现大数据系统的故障和问题的快速洞察与自治能力,已成为行业迫切需求。

拼模型、拼向量库的时代结束了?MongoDB 正在重写 AI 检索的基础设施
MongoDB 在 Atlas 上推出 Embedding 与 Reranking API。

当 AI 吞噬软件,数据正在成为企业唯一的护城河
作者|关涛、苏郡城审校|李文朋编者按:近日编者获悉,国内领先的数据平台公司“云器科技”完成 B 轮融资,其聚焦在亚洲市场,产品战略对标 Databricks。


2026 年 AI 与数据发展预测
智能体 AI (Agentic AI) 的崛起,将重塑企业的形态,亦将锻造一代新型的从业者。

从三大支柱出发:Snowflake 平台的一次系统级升级
探索 Snowflake 在易用、互联、可信平台上的各项新特性,涵盖计算、可管理性、安全治理及业务连续性 / 灾难恢复,全面加速您的数据与 AI 创新进程。

如何用 dbt MCP 服务器和 Snowflake 构建智能体工作流
关于 dbt 模型上下文协议服务器,并演示开发人员如何运用 dbt MCP 服务器与 Snowflake 在结构化数据之上构建智能体工作流。








