在生成式 AI 快速走向工程化落地的背景下,企业真正面临的挑战,已不再是有没有数据,而是如何让长期被忽视的非结构化数据,真正参与到业务分析和决策之中。在 BUILD 2025 的这场技术分享中, Snowflake 产品经理 Jessie Felix 以《非结构化数据的转化:从复杂挑战到竞争优势》为主题,系统讲解了 AI SQL 如何成为连接非结构化数据与企业分析体系的关键能力。
Jessie Felix 在数据与分析领域工作超过十年,长期参与企业级数据战略建设。正是基于这些实践经验,他指出了一个长期存在却常被低估的事实:尽管 80% 的企业数据以非结构化格式存在,如文档、文本、图像等,但它们却往往是分析最少、使用最少的数据资产。AI 的出现,正在改变这一局面。

让原本无法分析的数据进入分析体系
在这场分享中,Jessie 给出了一个清晰的 AI 认知模型:AI 的核心价值,并不只是提升模型能力,而是让组织可以处理过去难以处理的数据类型。文本、文档、图像、音频、视频等多模态数据,过去往往需要 NLP 或计算机视觉等高度专业的技术团队才能分析,如今则可以通过更通用的方式纳入分析体系。
这种变化,直接带来的结果是:一方面,可分析的数据规模被极大拓展;另一方面,分析型应用的能力上限随之被整体抬高。Jessie 指出,这正是 Snowflake 持续投入的方向之一,让结构化与非结构化数据能够在同一平台、同一治理体系下被统一分析。
在 Snowflake 中,数据无需被搬移到新的系统即可直接应用 AI 能力,这使得企业在控制力、安全性、可扩展性与成本效率之间不必做艰难取舍。更重要的是,这种方式正在推动客户构建她所称的“下一代应用”:能够同时理解结构化指标与非结构化语义,从而真正贴近业务语境。
分享中提到的客户实践覆盖多个场景,从通话文本中的情绪分析,到供应商合同的自动对账;从广告创意反馈分析,到合规流程的自动化处理。这些应用的共性在于,它们都依赖于对非结构化内容的规模化理解。
AI SQL:将多模态分析能力压缩进 SQL 体系
如果说 AI 是能力前提,那么 AI SQL 则是让这些能力可被广泛使用的关键接口。在 Snowflake 的设计中,AI SQL 被定位为多模态分析的基础层,它让非结构化数据的理解、过滤、聚合与结构化查询,回归到开发者与分析师最熟悉的 SQL 工作流中。
通过 AI SQL,用户可以直接访问来自 OpenAI、Anthropic、Meta、Mistral AI 等主流大模型的能力,而底层的基础设施、推理扩展和运维复杂性则由平台统一管理。数据始终留在 Snowflake 内部,安全与治理不被削弱。
在功能层面,分享中系统介绍了几类核心能力:
AI Classify:用于文本或图像的高质量分类,只需定义标签并指向数据集即可完成;
AI Transcribe:支持大规模音频转录,提供词级、说话人级分段,并具备多语言能力;
AI Extract:用于从文本、图像、文档中结构化提取关键信息,支持零样本高精度抽取;
AI-SENTIMENT、AI-FILTER、AI AGG:分别用于情绪分析、语义过滤与智能聚合。
这些能力的共同特点在于:它们不是零散的 AI API,而是可以被直接嵌入 SQL 查询链路中的原生算子。这使得原本需要多阶段管道、复杂编排的分析流程,可以被压缩为更简洁、可维护的查询逻辑。
通话录音如何转化为分析结论
为了更具体地展示 AI SQL 的价值,Jessie 在分享中用一个完整的“通话后分析”场景进行了演示。假设分析师面对一家客户支持咨询公司,需要理解大量通话录音背后的业务问题与改进空间。
整个流程并未依赖复杂的系统集成,而是通过一系列 SQL 操作逐步完成:
首先,对存储在内部阶段的音频文件进行转录,并生成包含音频时长与文本内容的结果对象。随后,在正式分析前,对转录文本中的个人敏感信息进行自动去敏处理,确保合规。
在此基础上,分析师开始引入业务语义:通过 AI Classify,对通话涉及的产品类型与问题类型进行多标签分类;通过简单的聚合查询,迅速定位出通话量最高的服务类别;进一步分析发现,交易与账户访问问题是来电的主要驱动因素。
接下来,AI-FILTER 被用于判断问题是否得到解决,而 AI-SENTIMENT 则从整体、代理、客户及产品满意度等多个维度分析情绪。结果显示,未解决的通话几乎全部伴随着负面情绪,且问题高度集中在特定业务线。
最后,AI AGG 被用于从大量非结构化内容中总结可执行建议,直接生成可反馈给管理层的行动项,包括流程改进、系统稳定性、授权机制等方面。
整个过程中,分析师并未跳出 SQL 语境,却完成了从音频处理、语义理解到业务决策建议的完整闭环。
在分享的结尾,Jessie 强调了一个核心判断:非结构化数据不再是企业数据体系中的障碍,而正在成为放大业务洞察的关键资产。AI SQL 的意义,不只是提升效率,更在于将原本只有少数专家才能触及的分析能力,扩展给更广泛的数据工作者群体。
当非结构化数据被赋予结构,并能够与结构化数据自然结合,组织就能在一个统一平台上完成治理、分析与决策。这种能力,正是构建下一代数据驱动应用的基础。
原视频地址:https://www.snowflake.com/en/build/americas/agenda/?login=ML
🔥【活动推荐】2 月 2 日-6 日,Snowflake Discover 重磅上线!这是一场免费、线上、可实时互动的技术活动,旨在帮助您全面提升数据与 AI 能力,深入了解如何更高效地管理、整合与分析数据。4 天时间 18 场技术干货分享,由来自亚太地区的一线技术专家亲自分享与讲解~

点击报名 Discover,更多 Snowflake 精彩活动请关注专区。





