2026 年,智能体将在企业级应用中取得哪些实质性突破?点击下载《2026 年 AI 与数据发展预测》白皮书,获悉专家一手前瞻,抢先拥抱新的工作方式!
那种将数据目录仅视为记录系统的观念已经过时,随之消亡的还有为创建和维护该目录所需的纯手工劳动。在智能体、副驾驶与自主分析的时代,我们需要的是一个通用型人工智能目录——它内嵌于系统之中、具备互操作性、富有韧性,并且专为以机器速度进行推理而构建。
“通用型人工智能目录”并非一个花哨的流行词。“人工智能目录”指的是一种具备上下文知识的智能目录,能够使人机智能体工作得更快、更高效。而“通用型”则指向互操作性,其视野能够超越像 Snowflake、AWS 或微软这样的单一平台,覆盖整个数据资产生态系统。
通用人工智能目录的必要构成要素
一个通用人工智能目录的必要构成要素包括以下两大核心:
语义层:位于复杂原始数据(存储于数据库或数据湖)与需要调用这些数据的用户或 AI 智能体之间的业务友好型中间层;
全域互操作性:指数据目录在面对跨平台、跨格式、跨引擎的碎片化数据资产时,能够统一实现治理、安全管控及元数据管理的能力,无论底层采用何种云平台、存储格式或计算引擎。
下文将对上述概念进行深入剖析,并阐释其必然的内在关联。
机器的语法体系:AI 智能体为何依赖语义层
机器智能的运行需依赖语境信息,而承载这一信息的关键组件即为语义层。传统数据目录仅提供列名等原始数据结构,面向 AI 的数据目录则通过语义层构建知识体系——即明确界定数据在具体业务场景中的真实含义。
人类可以从列名推测字段含义,但 AI 智能体在执行指令时具有字面理解与语境盲区。例如:智能体虽能识别“TX_LMT”为数值型字段,却无法判断其货币单位或所属地域;更严重的是,可能将其误读为“tax limit”(征税限额),而其实际含义却是“tax local municipal total”(地方市政税费总额),从而引发重大错误。语义层可为字段提供精确定义,如同设置刚性护栏,强制智能体与人类共同遵循既定的业务逻辑、语境及定义规范。
语义层的可靠性,完全取决于底层治理体系的完备程度。通过整合敏感数据保护、数据血缘追踪、数据质量监控,以及基于角色的访问控制(RBAC)与基于属性的访问控制(ABAC)等策略,数据治理将从静态限制演进为动态防护机制。这种融合确保了面向人类与机器的数据共享过程具备准确性、可追溯性,并在架构层面受到安全策略的约束——这些策略能够根据数据敏感等级实时调整权限配置。
一次治理,全域生效:为何缺乏互操作性的智能会力有不逮
语义层提供的是深度(即含义与知识),而通用互操作性提供的则是广度(即贯穿整个数据资产范畴的触达能力),二者共同构成了一个通用目录。若缺其一,你的 AI 战略要么是“有脑无体”,要么是“有体无脑”。
在通用 AI 目录中,安全策略(如数据脱敏、细粒度访问控制)已内嵌于可互操作的访问路径之中。当 AI 智能体通过第三方计算引擎访问数据时,目录所承载的语义智能会随之流动。智能体受目录中蕴含的知识所约束,因此无论使用何种工具,敏感数据都能始终受到保护。
当你将语义层与具备通用互操作性的目录相结合时,便拥有了企业的控制中枢,其优势包括:
规模化扩展:未来新增数据源或新 AI 模型时,无需从零开始重建治理体系;
敏捷性:由于语义层贯穿整个目录,任何业务定义的更新均能即时在所有位置生效;
可信赖性:你不再只是期望员工与智能体遵守政策,而是确切知晓他们在遵守—因为治理规则与它们所消费的数据已密不可分。
当前企业数据目录市场
当前企业数据目录市场发展至今已有十余年。传统企业数据目录的核心功能始终是集中管理元数据、构建业务术语表,并协助组织搜索可信数据,其目标是打造一个“数据领域的谷歌”,使分析师能够找到所需的数据表并明确其归属。
随着人工智能的兴起,重心已从人工浏览转向机器推理。许多传统数据目录难以完成这一转型,原因在于它们只能充当被动的存储库,而无法成为主动的智能控制平面。
一个组织若希望成功部署 AI 智能体,就必须摒弃这些孤立的资产清单,转向如 Snowflake Horizon Catalog 这类通用 AI 目录。该目录能够将安全控制措施嵌入每一次查询,从而主动降低风险。同时,它还能提升运营敏捷性,使组织在扩展数据源或更新 AI 模型时无需重建治理框架,从而确保企业在保持韧性的同时,始终具备创新就绪的状态。

Snowflake Horizon Catalog:面向全企业的通用 AI 数据目录
语义上下文层
传统数据目录擅长数据资产的记录与描述,但 AI 智能体所需的远不止现有数据的词汇表——它们需要真正的业务上下文。大语言模型在生成 SQL 方面表现出色,但在处理关系语义时往往力不从心,且在推断数据粒度、多跳连接、桥接表以及避免细微重复计算等方面,可靠性难以保证。一个查询在语法上可能完全合理,但在语义上却可能是错误的。
Horizon Catalog 提供了语义视图(semantic views),其功能超越了传统的描述性元数据。Snowflake 内置了一套编译引擎,能够识别实体、关系、指标、维度以及有效的连接路径,并在查询时强制执行这一结构。我们不再要求大语言模型从表名和外键中推断业务含义,而是为其提供明确且可管控的语义契约。这相当于为智能体配备 GPS 导航系统,而非一堆纸质地图:智能体沿着受管控的路径得出结论,始终处于安全边界之内——因为这些边界本身就是语义定义的一部分。
当您使用一个提升了治理水平的数据目录时,其功能将更加强大。Horizon Catalog 不仅利用基础元数据,还提供深度的数据血缘追踪以记录数据流向,并集成数据质量监控以确保数据完整性。数据安全并非附加功能,而是整个体系的基础层,配合信任中心以及易于使用的敏感数据保护功能,可有效降低未授权方接触个人身份信息(PII)的风险。通过结合基于角色的访问控制(RBAC)与基于属性的访问控制(ABAC),企业能够从僵化的人工权限管理转向灵活、上下文感知的策略管理。
近日,Snowflake 宣布加入开放语义交换倡议(Open Semantic Exchange Initiative)。该倡议旨在创建一个通用的语义数据框架,通过开放、供应商中立的技术规范,标准化企业内部碎片化的数据定义,从而为更加开放、可互操作且智能化的数据生态奠定基础。
市场上其他产品(如 Databricks)也拥有现有的语义模型概念,但这些模型往往需要大量人工介入。Snowflake 支持从已有上下文(如 BI 模型、SQL 查询)中自动创建语义模型,并提供 AI 驱动的建议以持续改进和演进模型。这种方式更加高效,使企业能够立即启动 AI 驱动的数据分析,并确保语义上下文随业务变化而不断演进。此外,Snowflake 还会根据查询历史和使用数据生成优化建议,帮助语义视图在实践中持续提升。
易于实施的治理能力,随数据在生态系统各处流转
传统的数据目录大多是针对碎片化数据资产构建的——需要将来自多种工具和环境的元数据拼凑在一起。这种模式默认数据是分散的,治理只能在事后进行聚合。
Snowflake 颠覆了这一局面。数据、计算、治理与目录在一个统一平台内,跨云、跨区域地实现整合。随着 AI 加速数据的创建、共享与协作,企业无法承受脆弱且松耦合的治理外挂层。它们需要的是一个能够随机器速度的数据交互同步扩展的统一智能层。
例如,Databricks Unity 在其自身生态系统中表现优异——这固然是其优势所在。但它缺乏 Horizon Catalog 那种通用的覆盖能力,后者兼容任意引擎、任意数据格式、任意位置——涵盖 Snowflake 原生对象、开放表格式(如 Iceberg、Delta)数据(可由任意引擎读写),以及关系型数据库(如 SQL Server、Postgres)中的数据。Horizon Catalog 还能在 AWS、Azure 和 GCP 之间一致运行,并提供极高的架构灵活性,支持随时迁移到 Apache Polaris 等开源目录。
相比之下,Snowflake Horizon Catalog 原生内置了 Apache Polaris 和 Iceberg REST API,以支持开放湖仓一体架构。凭借完全的双向互操作性——包括已正式发布的外部引擎读取能力,以及即将开启公测的外部引擎写入能力——治理策略可以跨云、跨引擎随数据流转。即使数据通过 Apache Spark 等外部工具访问,行访问控制、列掩码等数据保护策略也会被自动执行。
这意味着治理随数据而行——遍布整个生态系统。而且,您不再需要人工干预来保障这一点:通过 Cortex Code,您只需使用自然语言,即可在数分钟内发现敏感数据并应用策略,几乎不需要专业技术背景。只需指示 Cortex Code 扫描特定数据库中的 PII,或审计现有的掩码策略,治理实施便从绊脚石变为不费吹灰之力之事。

Cortex Code 支持您通过自然语言查找敏感数据,并在数分钟内完成策略应用,几乎无需专业技术背景。
统一控制平面:语义理解与策略执行的交汇之处
AI 的成功在一定程度上取决于信任,而信任的建立需要一套从架构层面始终融入的治理框架。像 Snowflake Horizon Catalog 这样的通用 AI 目录正承担了这一角色,作为连接复杂业务逻辑与多样、异构数据资产之间的纽带。
当语义深度与通用互操作性相结合时,您便超越了单纯的数据管理,进入了智能体编排的新领域。这些能力若彼此孤立,固然各有价值;但一旦整合协同,便构成了切实有效的 AI 战略的先决条件。
点击此处,进一步了解 Snowflake Horizon Catalog。
原文地址:https://www.snowflake.com/en/blog/universal-ai-catalog-data-governance/

点击链接立即报名注册:Ascent - Snowflake Platform Training - China,更多 Snowflake 精彩活动请关注专区。





