写点什么

看完 Snowflake 这套新品,我更确信大模型吃不掉数据这个赛道

  • 2026-06-03
    北京
  • 本文字数:2431 字

    阅读完需:约 8 分钟

这两天在 Snowflake Summit,我盯着他们发布的一连串新产品,有个越来越强的感觉。

他们的编程助手叫 Snowflake Cortex Code (简称 CoCo),对标的是 Claude Code;他们面向所有员工的协作工具叫 Snowflake CoWork,对标的是 Claude Cowork;他们还做了 CoCo Desktop,对标 Claude Desktop。一家做数据起家的公司,几乎是对着一家顶级模型公司的产品线,一个一个做了过来。

这事第一眼看上去,像是数据公司和模型公司,在“企业 AI 落地”这个中间地带正面撞上了。但我越看越觉得,这场相撞恰恰说明了一件事:大模型再强,也吃不掉“数据”这个赛道。

两边都在往中间挤

先说清楚这场相撞是怎么发生的。

一边是模型公司在往应用层走。Anthropic 不只做模型,还做了 Claude Code、Cowork、Desktop 这一整套,让用户能直接用模型干活,而不只是调 API。模型公司发现,光卖模型能力不够,得离用户的真实工作场景更近。

另一边是数据公司在往 agent 层走。Snowflake 本来是个数据仓库,现在做编程 agent、做协作 agent、做桌面端,把自己从"存数据、查数据"的地方,变成"在数据上直接干活"的地方。

你看,一个从模型往下扎到应用,一个从数据往上长到 agent,两边都想占住中间那块最值钱的地——企业里用 AI 把活干完的那一层。表面上,这是一场抢地盘的战争。

但抢地盘的姿势,暴露了两边各自的底牌。

Snowflake 敢这么做,靠的不是模型比谁强

要说的是,Snowflake 做这套 agent 产品,靠的根本不是它的模型比 Claude 强。

恰恰相反,它的模型就是接别人的——它的平台上同时接着 Anthropic 的、还有别家的模型,让客户按需要自己选。它甚至直接做了一个 Claude Code 的插件。换句话说,在"模型能力"这件事上,Snowflake 完全不跟你拼,它大大方方地用最强的那个。

那它拼什么?拼的是它离数据最近、把治理做得最深、最懂企业那套乱七八糟的业务上下文。

他们产品负责人在台上说了一句话,我觉得是整场最关键的:模型一直在变、能力一直在进步,但数据是恒定的。他们要做的,是帮客户把数据,和当下最强的那个模型接起来,并且替这两边都管好治理。

这句话翻译过来就是:

模型是租来的、通用的、谁都能换;但数据是你自己的、独一份的、搬不走的。

Snowflake 把宝押在了后者上。

模型能力会平移,但它进不了你那层数据

这就是我说“模型吃不掉数据赛道”的原因。

大模型的能力,本质是通用的。它在编程上强、在推理上强,这些强是平移的——今天能帮 A 公司写代码,明天就能帮 B 公司写代码,对谁都一样。通用能力很值钱,但它有个天花板:它不属于任何一家具体的企业。

而一家企业真正的命根子,是它那层数据——你的客户怎么分层、你的“毛利”到底按哪个口径算、你那条供应链为什么这么排、你这个行业几十年攒下来的规矩。这些东西不在任何公开语料里,模型出厂时根本不懂,也学不会。它只能被一家一家企业,用自己的数据、自己的业务逻辑,一点一点喂进去、治理好、对齐口径。

模型可以从外面平移进来,但这层数据和治理,必须在企业内部长出来。它又苦又慢,得一个行业一个行业地啃,这正是大模型这种"通用选手"够不着的地方。

Snowflake 这场发布会其实在反复证明这件事。它有个新功能,给 agent 喂上企业自己的业务定义和上下文之后,同样的模型,干活的准确率有了明显的提升。模型没变,变的是它脚下那层数据地基。这说明:决定 AI 在企业里好不好用的,往往不是模型本身,是模型脚下那层数据。

所以真正值钱的,是数据加大模型

把这两边放一起看,结论就清楚了。

纯模型不够——它再强,也进不了你企业内部那层数据。纯数据也不够——一堆治理得很好的数据,没有强模型,也只是躺在那里。真正能在企业里创造价值的,是把两者深度结合:让当下最强的模型,跑在最干净、最懂业务、被治理好的数据上。

这也是为什么 Snowflake 不跟 Claude 拼模型,而是大方地用它,再把自己的全部力气压在数据和治理上。它很清楚,模型这一层它赢不了、也不必赢;但数据加治理这一层,是模型公司短期内吃不掉的护城河。

这个判断对所有做企业 AI 的人都成立:不要去和大模型拼通用能力,那是它的主场;要去做它做不到的事——离一个具体行业的真实数据和业务足够近,近到能把通用模型,调教成那个行业里别人替代不了的东西。

模型是水电,数据加业务理解才是护城河。

补充一点感受

写到这儿,还有一点感受,想单独说一下。

这套自然语言查数、自动分析、agent 助手帮你把活干完的能力,说实话,我们两三年前就提出了同样的想法,而且已经在众多中国大型企业里落了地。今天在 Summit 的现场,看着 Snowflake 把这些能力一个个发布出来,台下一阵阵惊叹的掌声,我心里是有点复杂的。

不是说他们做得不好——他们做得很好,工程能力、产品完整度都值得学。让我感慨的是另一件事:差距可能不在技术和产品本身,而在更外面的一层。

比如标准。同样的判断、同样的能力,最后能成为行业标准的,往往还是这些美国科技公司。语义层互通这件事,他们牵头成立了一个组织来定标准,全行业跟着参与。这种"定义规则"的能力,比做出一个产品要难得多,也值钱得多。

再比如这次大会,ThomsonReuters、Under Armour 这些大客户,都亲自上台为 Snowflake 站台,讲自己怎么用得好。这在中国几乎是不可想象的——绝大部分大型企业,是不会轻易公开为一家供应商背书的。一个愿意让客户站上台讲、一个客户连 logo 都不太愿意露,这背后是两种完全不同的产业生态。

差距还有很多别的原因,语言、资本投入的量级、整个生态的成熟度,每一条都不是一天能补上的。

说这些不是要泄气。我们的技术和产品从不输,甚至在不少场景上更早、更落地。但把价值讲清楚、把标准参与进去、把生态一起做大,这些“产品之外”的能力,是我们接下来真正要补的课。

技术可以追平,产品可以做好,但话语权是要一点一点挣的。

先把东西做出来、做扎实,然后大大方方讲给世界听——这条路没有捷径,但值得走。

作者:黎科峰博士,数势科技创始人兼 CEO。本文为个人观点。

🔍阅读原文:https://mp.weixin.qq.com/s/G5OQUEliCqObStgnHo4Vjg