生成式 AI 的投资回报远超预期?Snowflake 调研全球 1900 位企业与 IT 专业人士后发现平均 ROI 高达 41%!点击下载完整报告
随着生成式 AI 从原型走向生产环境,真正的挑战已不仅是模型质量,更是要构建能被团队大规模信任的系统。开发人员和数据工程师被要求交付的不仅仅是能够生成答案的智能助手、Agent 和辅助工具,还必须确保这些系统在可靠性、安全性和与业务逻辑的一致性方面做到尽善尽美。
本次分享中,Snowflake 首席数据与分析官 Anahita Tafvizi 凝练了来自 Snowflake 自身实践与行业顶尖构建者的深度交流,系统拆解了可信生成式 AI 的技术架构要点,内容包括:
语义层如何防止幻觉并保持一致性;
为什么可观察性和评估框架生产级 AI 的必备要素;
在开源与专有模型中实施权限管控、数据沿袭和可测试性;
数百个企业用例中常见的开发模式与反模式。

无论您正在将智能体扩展至生产环境,还是仅验证试点项目,这场分享都将为构建不仅智能、而且可信、安全且可复用的生成式 AI 系统提供前瞻性蓝图——为持久化的 AI 奠定基础。
信任,是 AI 能否走向生产的分水岭
在 Snowflake 的实践中,构建一个“能回答问题”的 AI Agent 并不困难,真正困难的是构建一个输出高度准确、可被团队信任、并能据此采取行动的 Agent。这一难点在数据与分析类场景中尤为突出。
分析型 AI 的输出往往具有唯一正确答案,例如季度收入、增长率或关键指标。一旦系统在这些问题上给出哪怕一次错误结果,信任便会迅速崩塌,用户会回退到 SQL 查询或电子表格——因为在那里,他们至少能够自行追溯逻辑、验证结果。
分享中反复强调了一个行业普遍存在却容易被忽视的问题:分析幻觉(Aalytics Hallucination)。即 AI Agent 给出了看似合理、引用了正确表格与来源、但最终却是错误的数值。在分析场景中,这类错误的破坏性远高于一般生成式应用,也正是许多 AI 系统“上线即沉默”的根本原因。
一个三层结构的“信任工程”框架
基于 Snowflake 自身从原型到生产的实践经验,团队将“信任”总结为一个需要被工程化设计的系统能力,而非单一功能,并提出了一个由三层组成的框架。
第一层:数据信任所有 AI Agent 必须锚定在企业唯一、可验证的数据真实源之上。为此,Snowflake 通过语义模型集中定义业务概念与核心指标,使 AI 与分析师使用的是完全一致的业务语言。同时,引入“已验证查询”机制,将经过人工确认的 SQL 逻辑作为标准答案来源,确保自然语言查询与分析师手写 SQL 得到的结果一致,从根本上避免分析幻觉的产生。
第二层:模型信任生成式模型天然是概率系统,而分析场景需要确定性。Snowflake 通过可观测、可测试的方式对模型施加约束:完整记录每次推理路径,引入基于真实答案的问题集进行持续评估,并通过 CI/CD 式的发布流程,在进入生产前设置明确的质量门槛。上线之后,Agent 并非“部署即完成”,而是通过真实使用数据不断迭代和补充新的已验证查询。
第三层:系统信任即便数据和模型足够可靠,缺乏治理同样会导致失败。分享中特别强调了三点:权限必须继承自底层数据对象,设计审查应成为标准流程,以及每个 Agent 都必须有明确的责任人,持续对安全性和质量负责。实践证明,这套治理结构并不会拖慢创新速度,反而为规模化落地提供了稳定基础。
一个真实落地案例:面向 6000 人的销售与市场 AI 助手
为了验证上述框架的有效性,Snowflake 以内部市场与销售团队为对象,构建了一款基于 Snowflake Intelligence 和 Cortex AI 的 AI 助手。该系统每天服务超过 6000 名销售与市场人员,每周回答超过 12000 个业务问题,早期用户的 NPS 超过 90%。
在演示中可以看到,系统通过清晰的界面向用户传递为什么可以信任这个答案:是否使用了已验证查询、完整的 SQL 执行过程、清晰的推理路径,以及在非验证场景下对原始资料的明确引用。正是这些可见的信任信号,使业务用户愿意将决策建立在 AI 输出之上,而不再仅将其视为辅助工具。
三个值得警惕的反模式
在总结实践经验时,Anahita Tafvizi 也指出了三个在企业中反复出现的典型误区。
将 AI Agent 视为“一次性交付”的系统,缺乏持续监控与迭代,最终导致偏移和失控;
使用模糊的“万能输入框”界面,却未明确 Agent 的能力边界,反而削弱了用户信任;
允许各团队建立临时语义定义,导致同一指标在不同场景下含义不一致,从源头破坏可信性。
这些问题并非模型能力不足,而是缺乏系统性信任设计的结果。
真正胜出的,是“被信任的系统”
这场分享最终回到一个朴素却极具现实意义的结论:在企业 AI 的竞争中,胜出的不会是最炫酷的系统,而是那些能够被团队长期信任、稳定产出价值的系统。
当信任被纳入架构设计的起点,用户采用、开发效率与持续创新都会随之加速。这并非一个关于模型参数或技术噱头的故事,而是一场关于工程纪律、治理能力与长期主义的实践总结。





