大数据
讲述数据获取、存储、管理、分析的方方面面,关注软件、实践、生态,挖掘最新的前沿技术,同时也思考大数据与AI和云计算的深度结合。
- 全部
- DataOps
- 数据集成
- DataMesh
- 数据编织
- 数据湖仓
- 在离线混部
- 实时计算
- 其他

借助 Cortex Code 加速构建:全面开放,轻松应对更复杂任务 | 技术趋势
现在每位 Snowflake 用户都可以在其安全且受治理的 Snowflake 环境中,直接使用 Cortex Code。

试点走向规模化盈利:生成式 AI 与智能体 AI 的 ROI 兑现路径 | 技术趋势
在生成式 AI 和智能体方面进行战略投资的企业,正在实现规模化加速并获取真实利润。

智能体企业架构浮现:数据、模型、系统之外的控制平面| 技术趋势
要有效驾驭智能体技术,企业所需要的不仅是模型和应用,还需要一个协调层——即一个中央控制平面,用于统一调配企业内的智能、数据、策略与执行,从而实现智能体之间的协同。

Postgres AI:从 RAG 技术到价值变现的蜕变 | BUILD 2025
为何 Postgres 堪称数据团队拥抱 AI 的终极武器?Snowflake Postgres 又如何为开发者提供开箱即用的生产级解决方案?我们将重点剖析其保持强大适应性的核心特性!

基于开源 Arctic 模型强大的 Text To SQL | BUILD 2025
如何基于 Snowflake 开源的 Arctic Text2SQL R1 7B 模型构建一个智能体:它能解析包含多个维度的复杂问题,并将其转换为针对数据集的准确高效 SQL 查询。我们还将现场演示如何通过 LlamaIndex 的 Workflows 数据编排抽象层,像搭积木般轻松设计智能体工作流。

启动快人一步,扩展智高一筹:在 AI 数据云上打造你的下一个智能应用 | BUILD 2025
全面了解 Snowflake 最新的应用开发能力:包括 Native App Framework 在 Shareback、应用可组合性等方面的大幅升级,以及专为托管类应用打造的更强多租户能力。

开源 Snowflake AI 工具包:数据云中的 AI 创新实践 | BUILD 2025
如果你正在寻找一种快速有效实践 Snowflake AI 功能的动手方式,本次分享正是为您量身定制!从编写简单的提示到在无代码环境中使用 Snowflake Cortex 功能(如文本生成、混合搜索、RAG)等)构建完整的智能体工作流,让你可以在几分钟内从想法过渡到原型。

解锁 Snowflake Intelligence, 释放数据潜能 | BUILD 2025
Snowflake Intelligence 全新发布!这款强大工具能助力企业将所有数据转化为实际行动。它支持您使用自然语言对结构化与非结构化数据进行提问,从而即时获取深度洞察并触发工作流,让数据与商业成果之间不再有距离。

新动向:新一代数据产品 | BUILD 2025
学习如何运用最新数据共享功能——包括 Iceberg 共享、语义视图共享、声明式共享、再共享等——来构建、管理并普及业务就绪的数据产品,从而驱动关键业务计划。

新动向:Analytics 更新 | BUILD 2025
准备释放数据的全部潜能了吗? 探索 Snowflake 如何让迁移至 AI 数据云变得前所未有的轻松。通过演示,独家预览我们最新的 AI 驱动 BI 与交互式分析能力,看如何迅速获取深度洞察。同时了解我们是如何在提升价格与性能的同时实现这一切的。

Snowsight 新功能一览:您的数据工作基石 | BUILD 2025
Snowsight 是 Snowflake 专为端到端数据工作打造的用户界面层,我们一直致力于将它打造成您处理数据工作的理想平台。你将收获工程副总裁 Vik Gupta 作为前客户和终端用户的亲身经历与独家见解。

聚焦 Spring Framework 7 与 Spring Boot 4:Spring 团队专访
InfoQ 近日采访了 Spring 团队核心成员,围绕 Spring Framework 7 和 Spring Boot 4 的架构与功能升级展开交流,重点谈及原生集成重试、并发限流等核心弹性能力,以及模块化自动配置带来的性能优化。

Airbnb 将高吞吐指标采集管道迁移至 OpenTelemetry
Airbnb 可观测性工程团队发布详细的大规模迁移方案,新系统在生产环境中每秒可处理超过 1 亿条指标样本。

Agent 下一战,决胜“记忆”之巅——AICon 深度专题前瞻
AICon 我们邀请到了来自 EverMind、MemVerge 和 OPPO 的三位专家。他们将分别从操作系统级长期记忆架构、独立于模型的 AI Memory 中间件、以及端云协同的全模态记忆工程三个硬核维度,为您呈现一场关于 Agent 的技术分享。

开源安全工具 Trivy 遭供应链攻击,引发行业紧急响应
一款被广泛使用的开源漏洞扫描工具 Trivy 最近发生了一起重大安全事件,暴露了软件供应链中的关键风险。维护团队确认,一个恶意版本曾短暂被分发给用户。这起事件由 Aqua Security 在 GitHub 讨论中披露。信息显示,攻击者成功发布了一个被篡改的版本,可能导致下游系统面临凭证泄露和恶意代码执行的风险。

Kubescape 4.0 为 Kubernetes 带来运行时安全和 AI 智能体扫描
开源的 Kubernetes 安全平台 Kubescape 4.0 版本正式发布,该版本新增了运行时威胁检测功能以及一系列 AI 时代的安全特性。这是该项目在原有扫描能力基础上,首次针对 AI 智能体自身安全展开防护。

Uber Hive 联邦架构:1.6 万数据集、10PB 数据去中心化,支撑大规模分析零停机
Uber 对其 Hive 数据仓库实施去中心化改造,采用基于指针的联邦架构完成超 1.6 万个、总量超 10PB 数据集迁移,实现零停机、严格权限管控与治理优化,为分析及机器学习业务提供可独立扩展的领域化数据集。

Aspire 13.2 正式发布,带来扩展版 CLI、预览版 TypeScript AppHost 及仪表盘改进
上月底,微软发布了 Aspire 13.2,为其云原生开发技术栈带来了大量的更新。这次发布主要致力于提升命令行体验、扩展多语言支持,为开发者和 AI 编码代理简化本地开发流程。

GitHub Actions 正式发布自定义 Runner 镜像
GitHub 刚刚宣布,其托管 Runner 现已支持自定义镜像。借助这一功能,团队可以使用经过 GitHub 批准的基础镜像,构建真正符合其工作流需求的虚拟机镜像。

Anthropic 因 npm 源映射文件意外泄露 Claude Code 源码
Claude Code CLI 因 npm 包误打包源映射文件导致完整 TypeScript 源码泄露,曝光了未发布功能、内部模型代号及多智能体调度架构。

BUILD 2025 主题演讲:实现 AI 规模化影响力
探索当前即可投入生产的最新 AI 创新技术,聆听客户的成功实践,观看真实的实战演示。您将了解从业者如何轻松运用最新的 AI 能力,实现企业级规模驱动效率、生产力与商业价值的全面提升。

TigerFS:将 PostgreSQL 数据库挂载为文件系统,面向开发者与 AI 智能体
TigerFS 是一款实验性的文件系统,可将数据库挂载为目录并将文件直接存储于 PostgreSQL 中。它通过标准文件系统接口开放数据,让开发者与 AI 智能体无需借助 API 或 SDK,即可使用 ls、cat 等常见 Unix 工具直接交互。

大规模替换数据库序列,保障百余个服务平稳运行
本文围绕关系数据库迁移 NoSQL 的难点展开,聚焦唯一标识所需的数据库序列,介绍了基于 DynamoDB 和双层缓存架构构建的新型序列服务。

“随选随配”的自定义区域:Cloudflare 推出细粒度数据驻留控制
Cloudflare 最近推出了自定义区域,这是对其区域服务的一次扩展,让客户可以精确定义数据在哪些地方被处理。通过按国家或地区选择特定的数据中心组合,客户可以确保 TLS 终止和应用层处理始终发生在指定的地理范围内,从而满足合规和数据控制需求。

HashiCorp Vault 1.21 带来 SPIFFE 认证、细粒度密钥恢复等新特性
HashiCorp 发布了 Vault 1.21。这个版本为非人类的工作负载引入了原生 SPIFFE 认证,扩展了在 Vault 1.20 中推出的细粒度密钥恢复模型,并新增了 KV v2 密钥归属信息、MFA TOTP 自助注册、一个 Vault Secrets Operator 的 CSI 驱动(可以把密钥直接挂载到 Pod 中且不落盘到 etcd),以及其他多项改进。

实验性 Web Install API 试图改进应用发现与分发方式
一个新的实验性 Web Install API 目前已在微软 Edge 和 Chrome 中进入 Origin Trial(源试用)阶段。这个 API 允许开发者在应用内部的用户交互中,以编程方式触发 PWA 的安装提示。它的目标是简化软件的发现和分发流程,尤其适用于那些不知道浏览器地址栏里有安装图标,或者平时不使用应用商店的用户。

利用 Snowflake Cortex AI 能力,打造高效 IPO 研究智能体 | 技术实践
本快速入门指南旨在指导您构建一个 IPO 研究智能体,该智能体充分利用 Snowflake Cortex 的核心功能。

Snowpark Connect 完全指南:PySpark 作业执行与生产数据管道构建 | 技术实践
本综合指南将带您深入了解 Snowpark Connect 如何在 Snowflake 基础设施上高效执行 PySpark 作业,并掌握构建可用于生产环境的数据管道的方法。

AWS S3 推出账户级区域命名空间,结束存在长达 18 年之久的全局存储桶名称冲突
近日,亚马逊云科技宣布为 S3 通用存储桶推出账户级区域命名空间,解决了困扰开发者 18 年之久的一个限制性问题——全局存储桶名称冲突。

绿色 IT :如何减轻 AI 对环境的影响
AI 对绿色 IT 提出了重大挑战:每次查询都会消耗大量的能源,GPU 芯片的使用寿命仅为 2-3 年,而且用户看不到相关成本。








