2025云栖大会,开启通往AGI的未来之旅 了解详情
写点什么

Snowflake 云数据仓库原生语义视图:为企业解锁轻松、高效、可信的 AI 驱动商业智能 | 技术趋势

  • 2025-09-20
    北京
  • 本文字数:4708 字

    阅读完需:约 15 分钟

大小:2.09M时长:12:12
Snowflake 云数据仓库原生语义视图:为企业解锁轻松、高效、可信的 AI 驱动商业智能 | 技术趋势

AI 驱动的商业智能(BI)正在重塑企业数据处理模式。企业软件生态中正广泛部署对话式分析体验,这些文本转 SQL 技术直接应用于不透明且难以重构的企业级模式时容易出现幻觉现象。为解决这一挑战,语义层充当原始数据与有效洞察之间的桥梁,确保 AI 与 BI 系统对信息进行一致且精准的解读。通过将组织语境和业务定义嵌入数据层,语义模型使 AI 驱动的 BI 解决方案能够提供可信答案,赋能业务用户做出精准决策。


在本博客中,我们会介绍 Snowflake 云数据仓库语义视图——这是一种新的模式级对象,可将所有语义模型信息原生存储在数据库中,取代当前存储在 stage 中的 Cortex Analyst YAML 文件。语义视图的开发源于一个常见的客户需求:客户既希望获得 AI 驱动的对话式分析功能,又担忧非受管的数据访问以及答案不一致或不准确的问题。这些客户通常还使用多种 BI 工具,他们希望:


  • 解锁 AI 驱动的分析用例(例如使其数据具备 AI 就绪能力),包括对话式分析;

  • 确保现有 BI 仪表板和报表使用与 AI 驱动分析界面相同的语义概念;

  • 将语义模型从 BI 工具层迁移至核心数据平台层,以保持语义信息与物理数据布局的一致性。

 

近期一位客户向我们展示了其理想架构图(此处稍作修改),其愿景如下:



我们看到这张图片时非常兴奋,因为它精准体现了我们开发语义视图的初衷:提供统一的接口(同时支持元数据和查询操作),为 Snowflake 客户的 AI、BI 和 SQL 分析提供支撑。


Snowflake 语义视图解锁了跨用户界面的强大分析能力,涵盖 AI 驱动分析、BI 客户端、Streamlit 应用、Workspaces、Notebooks 及自定义应用程序。它们捕获了关于底层模式(包括表结构和关联关系)的丰富语义信息,并将这些信息以业务相关概念的形式(如指标、维度和事实)呈现给数据消费者。在 Snowflake 中,语义视图捕获了确保 AI 驱动分析一致性及准确性所需的元数据,例如同义词、样本值和已验证查询。Snowflake 的 Cortex Search 服务通过检索增强生成(RAG)技术增强语义视图,为自然语言查询提供高质量检索结果。

创建语义视图


下面介绍语义视图模式对象的基础知识。您可以通过 Cortex Analyst 界面、Snowsight 中的数据库对象资源管理器或 DDL 语句在 Snowflake 中创建语义视图。语义视图定义至少包含:


  • "物理"模型对象(表、视图或未来的 SQL 查询)

  • 这些物理对象之间的关系

  • 维度(用于分组和分析查询筛选的业务友好型属性)

  • 指标(代表关键绩效指标的业务友好型计算与聚合)


您可以在我们文档的此处查阅关于语义视图模型定义语言的详细说明。

 

以下为创建语义视图的 DDL 语句示例:


CREATE OR REPLACE semantic view TPCDS_SEMANTIC_VIEW	TABLES (		CUSTOMER primary key (C_CUSTOMER_SK),		DATE as DATE_DIM primary key (D_DATE_SK),		ITEM primary key (I_ITEM_SK),		STORESALES as STORE_SALES      		)
RELATIONSHIPS ( STORESALES(SS_CUSTOMER_SK) references CUSTOMER(C_CUSTOMER_SK), STORESALES(SS_SOLD_DATE_SK) references DATE(D_DATE_SK), SALESTOITEM as STORESALES(SS_ITEM_SK) references ITEM(I_ITEM_SK), )
DIMENSIONS ( CUSTOMER.BIRTHYEAR as C_BIRTH_YEAR, DATE.DATE as D_DATE, DATE.YEAR as D_YEAR, ITEM.BRAND as I_BRAND, ITEM.CATEGORY as I_CATEGORY, )
METRICS ( STORESALES.TOTALSALESPRICE as SUM(SS_SALES_PRICE), STORESALES.TOTALSALESQUANTITY as SUM(SS_QUANTITY) );
复制代码


语义视图原生集成于 Cortex Analyst 分析平台,是提供高质量对话式分析体验的核心组件。


图 1:用户可通过 Cortex Analyst 创建和管理语义视图


在 Snowflake 平台中,语义视图不仅支持传统 BI 元数据(事实表、维度表和指标),还包含对高质量 AI 驱动分析体验至关重要的元数据。通过 Snowsight 的语义视图建模界面,可扩展配置样本值、已验证查询和自定义指令等元数据要素。


图 2:语义视图的维度可通过填充样本值进行丰富


可为语义视图添加自定义指令,以确保生成高质量且专属于分析领域的响应。


图 3:语义视图中的自定义指令有助于提升 Cortex Analyst 的响应质量


此外,可将已验证查询关联至语义视图,通过提供上下文进一步提高 Cortex Analyst 的响应质量。


图 4:用户可在 Analyst 界面中为语义视图添加已验证查询


最后,Snowflake 语义视图中的维度可依托 Cortex 搜索服务,实现响应自然语言查询的沉浸式"对话式数据查询"体验。


图 5:为维度关联 Cortex 搜索服务有助于将用户问题与数据库中的准确值进行匹配

从零到语义视图


在我们与语义视图的早期采用者交流过程中,除对 AI/BI 共享数据平台接口理念的高度认可外,一个持续反馈的共性问题是如何快速构建高质量语义模型。企业的"语义逻辑"通常分散于多种现有载体:既存 BI 工具模型、内部客户仪表板、数据科学团队使用的 SQL 笔记本,甚至内部知识库。为简化这一流程,我们开发了 AI 驱动的语义视图助手(当前处于私有预览阶段),该助手能帮助数据团队利用现有资产,在数小时内完成从零到语义视图的构建。


图 6:Snowflake 的语义视图生成助手利用现有构件和过往查询记录,快速启动语义视图创建流程


我们对此功能的广阔前景充满信心,并热切期待将其交付至客户手中。

语义视图“功能解析”


语义视图一旦创建,即可驱动多种分析场景。在 Cortex Analyst 中,用户能够对语义视图提出自然语言问题并获取高质量响应。


0:10

在今日的 Snowflake 峰会上,我们进一步发布了针对 Snowflake 语义视图执行 SQL 语句的能力。这使得开展 AI/BI 计划的团队能够:在确保跨所有操作界面(包括 BI 工具、Streamlit、Snowflake Intelligence 及 SQL 客户端)保持统一治理与访问控制的同时,提供简易的 AI 驱动数据访问体验。


如下代码片段所示,通过采用 SELECT * from SEMANTIC_VIEW () 语法结构,可使用新增的 SELECT 子句从语义视图中查询核心指标与维度数据。


SELECT * FROM SEMANTIC_VIEW(  ADVANCED_ANALYTICS_SAMPLE_DATA.TPCDS_SF10.tpcds_semantic_view_sm    DIMENSIONS             Item.Brand,            Item.Category,                        Date.Year,            Date.Month,            Store.State    METRICS         StoreSales.TotalSalesQuantity       WHERE Date.Year = '2002 AND Store.State ='TX' AND Item.Category = 'Books'    )ORDER BY TOTALSALESQUANTITY DESC LIMIT 10;
复制代码


当执行语义 SQL 语句时,Snowflake 会通过将业务概念(如"总销售数量")映射到语义视图元数据中定义的相关度量和关联关系来编译查询。SQL 规划器利用语义定义中的关键关系和维度映射生成有效的查询计划,确保一致性与最优性能。这意味着分析师可以专注于业务逻辑编写高层级查询,而无需关注物理表、晦涩的列名和连接关系。此外,作为 Snowflake 原生模式对象,语义视图具备对象级访问控制功能。您可以像对表和视图一样,对语义视图授予或限制使用及查询权限,从而确保跨 SQL、BI 和 AI 端点的授权受控使用。如需了解更多关于如何编写"语义 SQL "的信息,请参阅此处的详细说明。

 


由于 Snowflake 语义视图专为驱动高质量人工智能体验而构建,它们能够为"对话式数据查询"场景提供高质量的结果。在 Cortex Analyst 中我们发现,语义视图有助于减少幻觉现象、消除结果冲突,并显著提升用户对 AI 生成结果的信任度。通过为语义视图引入 Semantic SQL 能力,我们采用创新的混合查询路由方式提升了结果质量。借助新推出的"路由模式"功能(当前处于私密预览阶段),Cortex Analyst 将尝试优先采用新的 SELECT * FROM SEMANTIC_VIEW 语法来解答所有问题。若问题无法通过此方式解答,系统将基于基础模式构建查询。这使得 Cortex Analyst 既能享受语义视图带来的一致性优势,又能灵活回归基础模式以应对更复杂的问题。该方法实施效果(如图 7 所示)显示,在我们的文本转 SQL 基准测试中获得了更高质量的响应。


图 7:在语义上下文和语义 SQL 的双重加持下,Cortex 分析师响应质量实现显著提升


最后需要强调的是,语义视图通过抽象底层模式复杂性,并向数据消费者提供业务友好型术语映射,因而特别适合构建和共享数据产品。在本周发布的新功能中,我们激动地宣布:语义视图现可关联至 Snowflake 数据市场的产品列表。


图 8:语义视图可附加至 Snowflake 数据市场的数据产品列表

合作伙伴发展动态


随着对语义视图新增基于 SQL 的查询支持,客户现已能够使用合作伙伴产品直接查询语义视图。


在 Sigma 平台中,用户可通过直观的电子表格式界面访问语义视图,其操作方式与访问数据仓库中的物理表完全一致。终端用户无需感知数据来源是物理表还是语义视图——Sigma 通过抽象化所有底层复杂性,作为数据仓库的统一交互界面。语义视图中的所有维度均与 Sigma 中的列形成一对一映射,所有指标也与 Sigma 中的指标实现一一对应。Sigma 始终直接查询语义视图,确保定义始终保持同步:一旦在语义视图中更新逻辑,变更将实时自动同步至 Sigma。


用户基于指标或表开始分析后,即可使用 Sigma 的核心功能:数据切片、透视、筛选、仪表板构建乃至完整的数据应用开发。这一切都延续您所熟悉的 Sigma 体验,如今更由原生部署于数据仓库中的语义逻辑提供支持。

 

此外,Hex 现已实现与 Snowflake 语义视图的直接集成。通过 Hex 语义模型同步功能,您可以在 Snowflake 中定义语义视图并无缝导入 Hex 平台——这使得数据团队和业务用户都能更自信地探索数据,并借助 Magic AI 加速分析进程。在 Hex 的无代码探索体验中,您可以直接使用 Snowflake 中已定义的受管控度量指标、维度及关联关系。这意味着减少重复编写计算逻辑和核对数据差异的时间,从而将更多精力投入于为企业提供持续稳定的洞察分析。

 

Omni 的集成功能使用户能够借助直观工具——如 Excel 函数、自然语言查询、SQL 或点击式洞察分析——直接在 Snowflake 环境中并行分析语义视图与其他 Snowflake 对象。Omni 更进一步支持团队在工作簿中快速原型化指标与维度,并通过 API 将 DDL 回写至 Snowflake,从而实现高效便捷的 Snowflake 语义视图开发,并确保始终以 Snowflake 作为统一可信源。随着语义视图的持续演进,避免下游破坏性变更的难度日益增加——Omni 凭借模式刷新、动态开发测试环境和内容验证等强大开发者功能,始终保障分析内容与 Snowflake 环境保持同步。通过 Omni 与 Snowflake 语义视图的结合,团队可同时获得两方面的优势:既实现快速便捷的数据探索,又确保语义视图始终与业务发展同步。

 

RelationalAI 现与 Snowflake 语义视图集成,实现了 Snowflake 语义层与 RelationalAI 知识图谱的双向同步。您可以将知识图谱中定义的业务概念、度量指标和维度等语义元素直接导入 Snowflake 语义视图,使其能够被 Cortex Analyst 等工具调用。反之,Snowflake 中的语义定义也可同步至知识图谱,用以增强模型与应用能力。这种双向集成使企业能够跨系统统一数据与业务知识。以 Blue Yonder 为例,该客户运用 RelationalAI 为供应链规划构建复杂应用语义——这些语义现在可直接在 Snowflake 平台原生呈现。该集成帮助团队确保语义一致性,加速决策进程,并通过共享语义基础驱动智能应用。

发展展望


语义视图与 SQL 支持功能目前处于公开预览阶段。虽然我们的建模和语言支持已为 Cortex Analyst 提升质量并为基于 SQL 的查询提供基础能力,我们将持续快速迭代以开放更多新功能。未来将增强建模能力的精密度,并扩展 SQL 接口的语言支持。在持续拓展功能覆盖的过程中,我们欢迎通过专用渠道提交反馈或联系客户团队。了解更多可查阅语义视图文档,并通过快速入门指南亲身体验语义视图功能。

 

原文地址:

Snowflake’s Native Semantic Views: AI-Powered BI for the Enterprise

2025-09-20 09:0016

评论

发布
暂无评论

TDD、BDD、ATDD都是什么、有什么区别?(下)

禅道项目管理

TDD 自动化测试 BDD ATDD

京东商品列表数据接口(JD.item_search)丨京东API接口

tbapi

京东API接口 京东商品数据接口 京东商品列表数据接口 关键词搜索京东商品接口 京东商品API接口

大数据平台Bug Bash大扫除最佳实践

京东科技开发者

Databend 开源周报第 126 期

Databend

Data

用友ICT行业供应链数智化解决方案

用友BIP

供应链 ICT 行业

【鸿蒙千帆起】《开心消消乐》完成鸿蒙原生应用开发,创新多端联动用户体验

HarmonyOS开发者

HarmonyOS

舞台LED显示屏使用禁忌

Dylan

视频 LED显示屏 户外LED显示屏 led显示屏厂家

Apache IoTDB v1.3.0 发布|增加客户端服务器 SSL 通讯加密、写入负数时间戳等功能

Apache IoTDB

dubbo线程池打满问题解决-服务重启期间 mapstruct导致

常清静

dubbo 线程池 MapStruct

国内用户怎么申请Fomepay虚拟卡,支持ChatGPT、Facebook、亚马逊、google play、Apple id、奈飞

跨境

Google Cloud 亚马逊 openai ChatGPT 奈飞客户端

京东sku属性数据接口(JD.item_sku)丨京东API接口

tbapi

京东API接口 京东商品数据接口 京东商品sku信息接口 京东商品属性接口 京东API

华为云分布式云原生UCS,助力MetaERP构建企业级高可用分布式业务

华为云开发者联盟

云原生 华为云 华为云开发者联盟

开源协助平台工程灵活应对多云时代的挑战

SEAL安全

开源 运维 平台工程

CloudQuery的过去、现在和未来

BinTools图尔兹

CloudQuery

代码检查规则运营需关注的10大指标

华为云开发者联盟

开发 华为云 华为云开发者联盟 华为云CodeArts

基于AIoT物联平台的设备预防型维护助力光伏单晶行业实现设备精准维护!

用友BIP

资产管理 光伏单晶行业

DDD落地实践-架构师眼中的餐厅 | 京东云技术团队

京东科技开发者

自主研发国产堡垒机,助力企业信息安全可控

行云管家

网络安全 信息安全 堡垒机

软件测试训练营|从原理到实战,四天带你轻松进阶Python

霍格沃兹测试开发学社

多功能矢量图编辑器:Boxy SVG最新激活版

胖墩儿不胖y

Mac软件 矢量图编辑器 矢量图编辑

基于扁平化BOM的全业务应用领先实践,提升离散制造行业运营效率

用友BIP

智能制造

天谋科技工业物联网时序数据库 IoTDB 获 IT168 2023 技术卓越奖年度创新产品|技术&商品化双向认可

Apache IoTDB

使用 KubeSphere 与极狐GitLab 打造云原生持续交付系统

极狐GitLab

现代应用的定义

NGINX开源社区

弹性 应用开发 应用架构 可扩展性 可移植性

报名启动|OpenHarmony源码转换器—多线程特性转换赛题

OpenHarmony开发者

OpenHarmony

DAPP算力挖矿系统开发丨详情开发

l8l259l3365

专访 | STIF2023第四届国际科创节访第七在线CEO赵嘉程

第七在线

京东店铺所有商品数据接口(JD.item_search_shop)丨京东API接口

tbapi

京东API接口 京东商品数据接口 京东店铺所有商品数据接口 京东店铺数据接口

面向Java应用网络流的非侵入可观测指标采集联合方案 – Sermant & Gopher

华为云开源

微服务 Java、 sermant

Snowflake 云数据仓库原生语义视图:为企业解锁轻松、高效、可信的 AI 驱动商业智能 | 技术趋势_AI&大模型_Josh Klahr_InfoQ精选文章