写点什么

从第一性原理出发:那些构建 Snowflake 的理念,以及下一步走向 | 技术趋势

  • 2026-05-18
    北京
  • 本文字数:2680 字

    阅读完需:约 9 分钟

2026 年,智能体将在企业级应用中取得哪些实质性突破?点击下载《2026 年 AI 与数据发展预测》白皮书,获悉专家一手前瞻,抢先拥抱新的工作方式!

作为 Snowflake 创始团队的一员,看到十多年前我们所设想的一切,如今成为新兴 Agentic Enterprise 的基础,令人惊叹。2016 年,我们撰写了一篇论文,提出了一个大胆愿景:云中的技术世界和数据世界将如何被改变。十年后,我们很荣幸这项工作获得了 2026 年 SIGMOD Test-of-Time Award,这也让我们有机会重新回顾这篇论文,并反思我们的思考如何塑造了今天的 Snowflake,以及我们接下来将走向何方。

在论文中,我们概述了三项指导 Snowflake 创建的基础原则:

  • 汇聚所有数据: 我们希望构建一个平台,能够将结构化数据(传统数据仓库)与 PB 级半结构化数据(例如 Hadoop 等大数据)统一起来,在不牺牲核心数据库原则的前提下实现无缝分析:一等公民级 SQL、事务完整性和实时访问;

  • 利用云的弹性与可扩展性: 通过使用按需计算和几乎无限的扩展能力,Snowflake 可以处理所有数据和工作负载,彻底消除传统数据孤岛;

  • 让它简单易用: 作为一项完全自管理的云服务交付,我们的目标是消除管理数据基础设施的运维复杂性,让用户专注于洞察,而不是维护。

当我们在 2012 年创立 Snowflake 时,这些想法是大胆的,但它们为此后多年持续出现的创新和技术发展奠定了基础。

我们重新构想数据平台的那一年

2012 年,我们从根本上重新思考数据平台架构。

既有系统受制于一些在云时代已不再成立的假设。当时,软件受限于其所运行的硬件。计算与存储的紧密耦合,使性能、并发和成本之间形成取舍。云架构将其从这种约束中解放出来。

当时,我们有意识地做出了一个决定:将计算与存储完全且毫不妥协地分离。

这不仅仅是一个架构选择。它从根本上消除了定义数据系统数十年的那些取舍。通过解耦计算和存储,我们消除了资源争用这一限制因素。计算可以独立扩展,保持隔离,并支持多个工作负载同时在同一份数据上运行,且互不干扰。过去曾经是约束的东西,突然变成了竞争优势。

我们还承诺从第一天起就构建云原生架构,并以云对象存储作为基础。随着 JSON 等半结构化数据格式变得越来越重要,很明显,仅提供部分支持只会延续摩擦。让这类数据能够通过 SQL 被充分访问,不只是为了灵活性,更是扩大数据使用人群的必要条件。这关乎以一种真正有意义的方式实现访问民主化。

最后,我们引入了虚拟仓库,即弹性且独立的计算集群,可以按需扩展,这彻底改变了原有模式。过去,团队必须围绕固定基础设施来调整自己的工作负载;而现在,基础设施终于可以根据业务需求实时自适应。

正如我的联合创始人 Thierry Cruanes 常说的那样:“系统应当适应工作负载,而不是反过来。”

这些并不是优化,而是定义系统的架构决策。

将架构转化为影响力

想法是容易的部分,难的是执行。

在早期,挑战并不只是构建这个平台;还包括帮助市场理解它为什么重要。许多用户已经习惯于围绕固定容量调优系统,并将资源争用视为既定事实,但我们相信,这些约束只是旧架构设计的产物。

要证明我们的方法,需要持续做到以下几点:

  • 性能必须是可预测的;

  • 扩展必须能够自动运行;

  • 用户必须信任这个系统。

而且,这一切都必须让人感觉简单易用。功能总是可以增加,但消除复杂性需要纪律。最终,正是我们对简单性的极致专注,让 Snowflake 能够使系统更易于访问,并由此推动了广泛采用。

随着时间推移,客户的使用方式也在演进。最初从报表和分析开始,后来扩展到数据共享、协作、连续管道、机器学习和 AI 工作负载。那些最初将 Snowflake 用于分析工作负载的组织,如今正在直接基于这个平台构建应用,而所使用的仍是我们早在 2016 年就首次描述过的同一套架构和原则。

为 Agentic Enterprise 提供动力

随着 AI 嵌入每一项业务,我们正在进入下一次架构转变:Agentic Enterprise。

过去十年,Snowflake 帮助组织将其数据汇聚到单一平台之上。

我们当年做出的许多架构决策曾被视为非常规做法,但如今已经成为行业标准预期。计算与存储分离、弹性扩展、对半结构化数据的原生支持,已经不再是差异化优势,而是现代系统的基本要求。

使命仍在继续:系统现在承担着更加复杂的任务,而数据平台的角色也已经扩展。我们支持安全数据共享,驱动应用,并成为日益智能化系统的基础;这些系统已经不再只是专注于数据存储和查询。

今天,数据处于核心位置。企业正专注于释放数据的全部价值,而 AI 正在加速数据被使用、访问和转化为行动的方式。

AI 代理已经部署在客户支持、财务、销售和运营等领域。随着采用速度加快,一个熟悉的挑战正在浮现。这些系统往往是在孤岛中构建的,缺乏共享上下文、一致治理或协同机制,结果导致碎片化、信任有限以及影响力受限。

这是下一个需要打破的障碍。

如今,企业需要一个新的架构层:一个控制平面,将智能连接到企业数据,提供共享上下文,执行治理,并协调跨系统行动。

从许多方面来看,这是我们从一开始就希望构建之物的自然演进。在一个自主系统的世界中,数据作为单一事实来源的重要性只会进一步提升。现在,问题不再只是分离计算和存储。而是要以一种协调一致的方式连接数据、智能与行动。

下一个前沿,是让 Agentic Enterprise 成为现实,在企业级规模上无缝连接数据、智能与行动。

所有这些工作,都不是单一想法或单一团队的产物。

这项奖项认可的,是多年来工程、产品和市场进入策略等跨职能团队的努力;这些努力也一直受到客户协作的引导,而客户不断推动系统走向新的方向。

从一开始,以客户为中心就是 Snowflake 的核心价值观之一,并且它也将继续指引我们走向未来。我们的客户塑造了我们构建系统的方式,使系统更易于使用、运行更高效,从而让我们能够从他们的数据中释放非凡价值,帮助客户取得成功。

我们还必须感谢那些杰出的共同作者,他们的贡献是这项工作不可或缺的一部分,他们也一同获得了该奖项的认可:Vadim Antonov、Artin Avanes、Jon Bock、Jonathan Claybaugh、Daniel Engovatov、Martin Hentschel、Jiansheng Huang、Allison W. Lee、Ashish Motivala、Abdul Q. Munir、Steven Pelley、Peter Povinec、Greg Rahn、Spyridon Triantafyllis、Phillipp Unterbrunner 和 Marcin Zukowski。感谢你们的合作。

回顾过去十年,毫无疑问,世界已经发生了改变。AI 正在重新定义可能性,重塑我们构建和运营的方式。尽管格局仍在持续演进,但我们对创新和客户的承诺始终不变。对于未来,我无比期待。

原文地址:https://www.snowflake.com/en/blog/data-platform-ai-era/

点击链接立即报名注册:Ascent - Snowflake Platform Training - China更多 Snowflake 精彩活动请关注专区