大数据
讲述数据获取、存储、管理、分析的方方面面,关注软件、实践、生态,挖掘最新的前沿技术,同时也思考大数据与AI和云计算的深度结合。
- 全部
- DataOps
- 数据集成
- DataMesh
- 数据编织
- 数据湖仓
- 在离线混部
- 实时计算
- 其他

跨越数据孤岛:实现 100 家全球酒店绩效秒级监控的实战指南 |技术实践
本指南介绍了一个完全构建于 Snowflake 平台之上、面向多物业酒店组合的综合性高管智能平台。该平台专为 C-level 高管、区域总裁及战略决策者设计,通过自然语言 AI 智能体、实时分析及主动式情报,将原始运营数据转化为可执行的洞察,助力提升酒店组合整体绩效、优化会员忠诚度并打造卓越宾客体验。

作业帮 Flink On K8s 落地实践
本文主要分享 25 年 Flink on k8s 的探索与实践,包括选型思考、平台架构演进、日志观测、Flink 版本升级、兼容性适配、工具迁移、稳定性和性能优化等关键内容。

ClickHouse 不再只有一个主索引:投影正式进化为真正的二级索引,查询提速 90%
ClickHouse 表过去只能拥有一个主索引。现在它们可以拥有多个索引,这些索引通过轻量级投影实现,其行为与主索引一致,而且不会复制数据。

从零构建智能体:面向 AI 智能体的端到端数据管道搭建实战 | 技术实践
本文旨在指导您如何利用 Snowflake Cortex AI,完成从原始数据到可操作洞察的完整转化流程,重点关注情感分析与分类任务。

工业级 LLM 数据工程:北京大学 DCAI 团队 DataFlow 框架的架构设计与实践
大模型行业急需一套具备系统化抽象与工业级可靠性的数据治理基础设施。

深度集成亚马逊云科技与微软生态,以自然语言驱动智能决策 |Snowflake Discover AI 技术实战周 Day 4
借助 Cortex 与 AI SQL 构建自然语言驱动的数据应用体系,并联动 Amazon Quick Suite 与 Microsoft Teams 等生态工具,实现跨平台协作与业务场景深度融合。

打造 AI 就绪型数据基座 & 数据工程与数据科学实战 |Snowflake Discover AI 技术实战周 Day 3
围绕 AI 就绪型数据体系建设,聚焦统一摄取、数据质量监控与特征体系构建,夯实支撑 AI 持续演进的数据底座。

从企业 AI 战略全景到零帧起手玩转 Snowflake |Snowflake Discover AI 技术实战周 Day 1
系统梳理企业级 AI 的端到端落地路径,从战略规划、数据准备到 Agent 构建与业务价值衡量,搭建可规模化的 AI 实施框架。

从 AI 能力探索到企业级 Agent 与 GenAI 实战构建 |Snowflake Discover AI 技术实战周 Day 2
聚焦 Snowflake 上 AI 的真实应用场景与创新能力,探索企业智能 Agent、生成式 AI 与多模态能力的融合路径,推动数据资产向智能生产力转化。

从 ChatBI 到多 Agent 分析中台:Snowflake 与亚马逊云科技的实战架构
本文不再纠结「要不要做 ChatBI」,而是尝试回答一个更关键的问题:如何利用 Amazon Quick Suite、Bedrock AgentCore 和 Snowflake Cortex Agents,把「能聊天的 BI」升级为「能协同工作的数据智能中台」,并满足企业级落地的要求。

Snowflake China 与国内云对象存储的多云集成实战指南:一套架构打通多云对象存储
如何打通 Snowflake 与国产云厂商之间的“最后一公里”,实现真正的全云架构?本文将分 Snowflake China 如何在异构 Bucket 之上,利用 Apache Iceberg 搭建起高性能、统一治理的数据高速公路。

如何用 Streamlit 和 Snowflake Cortex 搭建语音助手应用 |技术实践
在本快速入门指南中,您将利用 Snowflake Cortex 的 AI_TRANSCRIBE 函数,构建一个支持语音交互的 AI 助手。用户可通过录制音频消息,经由系统自动转录并由大语言模型处理,实现智能化、自然的对话体验。

Netflix 将 400 个生产集群的 RDS PostgreSQL 自动迁移到 Aurora PostgreSQL
Netflix 介绍了他们内部的一个自动化平台。该平台将近 400 个生产集群的 Amazon RDS for PostgreSQL 数据库迁移到 Amazon Aurora PostgreSQL,降低了操作风险和停机时间。

强强联合:借助 Snowflake 与 Amazon Quick,释放 AI 驱动的商业智能潜能 | 技术实践
本快速入门指南将重点介绍 Snowflake 与 Amazon Quick 的集成方案,帮助用户构建由 AI 驱动的商业智能(BI)能力,实现对企业全域数据源的统一智能分析,并打通从洞察获取到行动执行的“最后一公里”关键环节。

作业帮 StarRocks 替换 Presto 落地实践
本文主要分享 25 年 StarRocks 替换 Presto 的探索与实践,包括历史背景、选型思考、技术方案以及过程中遇到的核心问题。

Uber 的混合云数据:工程师如何攻破解大规模复制难题
Uber 工程团队对其数据复制平台做了全面升级,现在每天可以在混合云和本地数据湖之间移动数以 PB 计的数据,解决了由于工作负载迅速增长而引起的扩展挑战。

GlassFish 8.0 发布,兼容 Jakarta EE 11,增强安全性并改进数据访问
经过 15 个里程碑版本的迭代,Eclipse 基金会正式发布了 GlassFish 8.0,带来了对虚拟线程的支持、增强的应用安全能力以及改进的数据访问功能。GlassFish 8.0 是 Jakarta EE 11 的兼容实现。Java Champion、OmniFish 联合创始人 Ondro Mihályi 就 GlassFish 8.0 接受了 InfoQ 的采访。

Pinterest 基于 CDC 的摄取系统将数据库延迟从 24 小时缩短至 15 分钟
Pinterest 推出了新一代数据库摄取框架,旨在突破传统批处理系统的局限性,提升实时数据的可用性。

Databricks 推出面向 AI 工作负载的 PostgreSQL 数据库 Lakebase
最近,Databricks 正式发布 Lakebase。这是一个基于 PostgreSQL 的无服务器 OLTP 数据库,能够独立扩展计算和存储。它旨在与 Databricks 平台集成,提供一种综合事务与分析能力的混合解决方案。

凭借全新数据原生开发工具,在 Snowflake 中更快地将创意投入生产 | 技术趋势
通过一系列的创新,Snowflake 帮助开发者摆脱在零散工具和窗口之间频繁切换的负担,真正把精力集中在创造价值上,不断拓展现代应用开发的边界,迈向由智能体驱动的 AI。

Snowflake 将 AI 就绪的企业数据置于您的指尖 |技术趋势
Snowflake 最新的平台增强能力覆盖事务处理、分析、自动化优化、互操作性以及企业级数据治理与韧性,本篇博客将有助于您深入了解 Snowflake 如何将数据、AI 与行动紧密衔接。

AI 在生命科学领域 2026 年发展展望 |技术趋势
随着 2026 年到来,生命科学整个行业都站在关键转折点上。在监管变化、经济压力和预算约束持续叠加的背景下,制药与医疗器械企业正将 AI 与数据民主化纳入核心战略,通过提升效率、推动创新、重构运营流程,加速药物研发与商业化落地。

关于采用 Snowflake Internal Marketplace 的最佳实践 |技术实践
Snowflake Internal Marketplace 能够极大简化数据产品与人工智能资产在企业内部的共享、治理、发现与使用流程。本文档结合实践经验,总结出一套适用于组织成功部署 Internal Marketplace 平台的最佳实践方案。

从表格到网络:图分析智能体如何重构工业决策体系 | 技术实践
为释放真正的运营韧性与效能,工业界正超越传统商业智能,转向能够理解互连关系的自主系统——图分析智能体。通过运用 Neo4j Snowflake 原生应用程序中的强大算法,这些智能体能够大规模分析复杂网络,将原始连接数据转化为主动的工业运营决策。


金融数据库国产实践:从能用到好用,腾讯云 TDSQL 成功案例精选
本白皮书共汇集了 14 个金融领域典型实践案例,覆盖了多个金融核心场景,便于你“找同类”—— 城商行、股份制银行、农信体系、保险、券商等不同主体,对稳定性、并发特征、迁移窗口与治理能力的要求并不相同。本案例集以多类型机构呈现差异化路径,你无需担心被单一“最优解”误导。

我们是否应该取消 BI 报告,追求对话式分析? | 技术趋势
在医疗健康领域,传统 BI 并未被取代,而是正在演进为一项融合描述性分析、预测性分析与交互式迭代探索的动态学科。

Snowflake Cortex Code:它是什么,为什么重要,以及何时使用它 |技术实践
Snowflake 正式发布 Cortex Code ——一款原生集成于 Snowflake 的 AI 编程助手,旨在显著缩短从构想到生产上线的周期,尤其适用于依赖受管企业数据的开发场景。

Dropbox 如何构建可扩展的企业知识搜索上下文引擎
Dropbox 工程师详细介绍了其团队如何搭建 Dropbox Dash 背后的上下文引擎,展示了从传统方案向基于索引的检索、知识图谱派生上下文以及持续评估机制的演进。

现代化 ML 技术栈:智能体、多模态与实时工作流正式发布 | 技术趋势
传统机器学习在当今人工智能领域依然至关重要,其作为预测洞察的核心驱动力,支撑着从供应链优化到实时欺诈检测等关键业务价值的实现。然而,从实验到生产部署的路径依然充满挑战:各生态系统工具碎片化,需要复杂的配置流程、多轮优化迭代以及持续的运维投入。 Snowflake 始终致力于打造现代化的机器学习平台,该平台与您的数据深度集成,提供统一的安全保障,并通过可弹性扩展的工作流加速业务价值实现。

一文读懂 Snowflake:7 个 AI 与语义层的关键策略要点 | 技术实践
本文围绕 Snowflake 平台语境,提出 7 项利用语义层实现 AI 就绪的战略建议。








