写点什么

一文读懂 Snowflake:7 个 AI 与语义层的关键策略要点 | 技术实践

  • 2026-02-13
    北京
  • 本文字数:3088 字

    阅读完需:约 10 分钟

2026 年,智能体将在企业级应用中取得哪些实质性突破?点击下载《2026 年 AI 与数据发展预测》白皮书,获悉专家一手前瞻,抢先拥抱新的工作方式!

语义层并非新兴概念。早在二十一世纪初我便开始使用该技术,并在多项分析解决方案(尤其是企业数据仓库)中主导其设计、配置与实施。

我曾使用多种语义层工具,包括 IBM Cognos Framework Manager 及微软数据平台的各类语义层功能。

事实上,几乎所有“商业智能(BI)+自助服务”场景都涉及语义层的应用。

近年来,由于智能体 AI 发展的需求,语义层正迎来复兴浪潮。因此,本文将围绕 Snowflake 平台语境,提出 7 项利用语义层实现 AI 就绪的战略建议。

注:本文全篇手动撰写,内容基于我的行业经验与专业知识、相关研究,以及对客户需求与行业趋势的观察。

利用语义层提升 Snowflake 平台上 Cortex AI Analyst 的 AI 提示准确性。如图所示,本例中的语义层集成位于顶部:VWS_CUSTOMER_DETAILS。图片来源:Dan Galavan

要点一:理解语义层的传统作用

首先需要明确基本概念。

根据《牛津英语词典》的定义:“语义学是语言学和逻辑学中研究意义的分支。

此外,维基百科将语义层定义为:

“……将复杂数据映射为熟悉的业务术语,例如产品、客户或收入。”

语义层能够为数据提供易于业务理解的、一致的解释视角,即一种抽象的“逻辑”视图。

 

数据抽象逻辑视图示例。图片来源:Dan Galavan

图中展示了一个抽象逻辑视图的示例,该视图在清晰描述数据的同时保持了更贴近业务用户需求的设计。

语义层可用于定义和配置以下内容:

  • 标准化定义与含义

  • 数据对象间的关系

  • 指标

语义层过去乃至现在仍广泛应用于商业智能场景。这对数据治理具有重要价值,有助于提升业务逻辑的一致性、可复用性及可维护性。

要点二:了解人工智能为何推动语义层“复兴”

通过语义层提升 Snowflake 平台上 Cortex AI Analyst 的 AI 提示词准确性。图中顶部的 VWS_CUSTOMER_DETAILS 即为此类语义层集成示例。

核心观点:语义层有助于提升 Agentic AI 文本转 SQL 的准确性。

换言之,当我们用 AI 增强商业智能分析时,若采用自然语言+智能体与数据进行交互,则必须将自然语言转换为底层数据仓库的查询语言(通常为 SQL)。

语义层可将大型语言模型处理(常称为“推理”)与基于规则的定义相结合。规则定义承载了业务理解与业务逻辑。

语义层有助于管控不准确性风险(亦称“幻觉”),从而提升可信人工智能的可靠性。

要点三:数据建模是这一领域的关键技能

如前所述,语义层是数据的“逻辑”或抽象视图。因此,在使用语义层时,我们无需深入了解数据存储库的内部工作机制。

但在设计语义层时,必须有人完成以下任务:

  • 确定使用哪些源数据库表及其他对象;

  • 梳理这些对象之间的关联关系;

  • 对语义层对象进行命名,确保其符合业务通俗性;

  • 制定相应指标逻辑;

  • 确认业务定义;

  • 简而言之,有效建立从物理数据库到语义层的映射关系。

物理数据模型示意图。图片来源:Dan Galavan

实现上述目标的前提是理解数据。从实施层面来看,数据建模角色最适合承担此项工作,同时需要结合业务用户等领域专家的意见进行完善。

要点四:AI 增强型语义层设计与人机协同机制

Human in the Loop:评估来自 Snowflake AI Cortex Analyst 的 AI 生成语义层建议。 图片来源:Dan Galavan

尽管人工智能能够提出建议并增强语义层设计,但从质量保证的角度来看,用户验证至关重要。若我们采用基于 AI 的语义层配置建议,则必须建立相应的“人机协同”审批流程,例如涉及:

  • 确定概念同义词;

  • 业务友好的描述定义;

  • 正确的提示词与查询组合。

以 Snowflake 云语义视图为例,其 Cortex AI 服务能够为语义层设计提供有益建议。这些建议可能包括描述、指标及查询语句。然而,必须由具备相应领域知识的系统用户对这些建议进行评估。

 

Snowflake Cortex Analyst 语义视图已验证查询。 图片来源:Dan Galavan

一个典型产出是已验证查询。在此场景中,系统会监测自然语言提示词及其对应查询,以识别潜在可复用的模式。一旦发现候选查询,系统将自动向用户推送建议。用户可选择接受、编辑或拒绝该条目。

要点五:技术栈兼容性

如同技术生态系统的任何组成部分,语义层的兼容性始终是需要考量的关键因素。因此,务必确保您的技术栈能够满足实际需求。

以 Snowflake 平台为例,其功能支持包括:

  • 配置语义视图时提供多种接口与选项,例如 SQL、用户界面、REST API 及 YAML 格式,并集成了智能体 AI 功能;

  • 支持第三方商业智能工具,如 Sigma、Omni、Honeydew 和 Hex;

  • 兼容第三方设计与交付工具,例如采用 dbt 进行集成测试,且其路线图中已纳入 SqlDBM 的设计功能。

要点六:语义层开放标准即将到来

该标准源于开放语义交换规范(OSI)。图片来源:Snowflake

开放标准不仅能降低供应商锁定风险,还有助于推动技术普及。当前,语义层开放标准——开放语义交换规范(OSI)正在制定中。

该标准主要关注以下三个核心领域:

  • 标准化:提供统一的定义语言;

  • 互操作性:促进数据交换;

  • 可扩展性:支持模型随数据需求演进而灵活适配。

该项目已获得众多机构的共同推进,参与方涵盖从 Blackrock 到 AWS 再到 Salesforce 等各类组织。

从数据与人工智能战略视角来看,这一开放标准将带来显著价值,特别是在 AI/BI 工具及相关互操作性方面。

要点七:面向语义层与智能体人工智能的治理方法

若无法将语义层开放给智能体人工智能(Agentic AI),则前述所有工作均无法实现。

再次以 Snowflake 平台为例,我们可以配置 AI 智能体,使其调用 Cortex Analyst 语义视图。这将为智能体提供我们在前文讨论的各个领域的明确指引,例如:

  • 数据含义;

  • 指标定义;

  • 针对智能体提示的已验证预制查询语句。

语义视图还可应用于 BI 工具、Notebook 环境或 AI/MCP 集成中。

利用 Snowflake Intelligence 功能,通过智能体人工智能+ Cortex Analyst 语义视图提交自然语言提示。图片来源:Dan Galavan

此外,Snowflake Intelligence 功能可结合前述 AI 智能体与语义视图对数据进行查询。我们能够通过提交自然语言提示生成图表,并识别数据趋势。另一优势在于,Snowflake 的生成式人工智能能力与平台整体的数据治理功能紧密结合。

我曾在生成式人工智能方兴未艾的 2023 年 Snowflake 全球峰会上就此话题发表过演讲。

结论

正如我们所看到的,语义层在与商业智能(BI)工作负载相关的领域虽已存在多年,但当前正迎来一场智能体人工智能(Agentic AI)的复兴。这场复兴的驱动力,源于确保“与数据对话”时实现可信人工智能的迫切需求。换句话说,这正是我们在“以 AI 增强 BI”的过程中所要应对的挑战。

然而,在此过程中,务必牢记以下几点:

数据建模在此背景下为何扮演关键角色

  • AI 增强如何助力语义层的设计

  • Human in the Loop 的重要性

  • 即将发布的开放语义交换规范

  • 采用治理化方法运用智能体人工智能(本文以 Snowflake Intelligence 平台的语义视图为例进行说明)

  • 综合考虑以上要素,将有助于有效推进数据与人工智能战略的落地。

我还有许多相关的实践建议希望分享,并期待能尽快抽时间撰写成文。敬请持续关注!

在此,预祝各位在语义层与智能体人工智能的探索之旅中一切顺利。如有任何疑问,欢迎随时联系

© Dan Galavan 2026

Dan Galavan 是一名独立的数据治理与数据管理顾问,拥有 27 年的客户咨询与数据解决方案交付领导经验。他自 2019 年起开始使用 Snowflake 数据平台,持有都柏林大学学院颁发的“商业高级人工智能”文凭,并已获得 Snowflake Snowpro 高级架构师认证。

原文地址:https://medium.com/snowflake/snowflake-in-a-nutshell-7-strategic-ai-semantic-layer-tips-78422f7e0bdc

点击链接立即报名注册:Ascent - Snowflake Platform Training - China更多 Snowflake 精彩活动请关注专区