写点什么

构建你的第一个 Snowflake 智能体:从概念到原型只需 3 步! | 技术实践

  • 2025-11-25
    北京
  • 本文字数:3095 字

    阅读完需:约 10 分钟

大小:1.46M时长:08:30
构建你的第一个 Snowflake 智能体:从概念到原型只需 3 步! | 技术实践

Agentic AI 远不止是最新的热门词汇,它更是一种颠覆性技术!


想象这样一个场景:您的数据不再被动等待您提出正确问题,而是持续主动地为您工作。一个智能化的 AI 智能体能够主动扫描您的 Snowflake 数据仓库,识别收入或客户参与度等关键绩效指标的异常下跌,并自动向您的团队发送实时警报,整个过程无需等待特定查询指令。


这标志着从被动响应数据到主动交互数据的范式转变,使您能够在问题浮现前就做出决策驱动。无论您身处零售、金融还是医疗领域,智能体 AI 都能将这种自动化与洞察能力转化为现实。


为什么需要 Agentic AI?


传统的数据分析工作流程是被动式的:提出问题、编写查询、分析结果。而智能体 AI 彻底颠覆了这一模式。如今,智能体能够规划多步骤任务、直接查询数据、分析结果,甚至自主执行后续操作——整个过程实现全自动化,无需人工干预。


这为无限可能打开了大门,包括但不限于:

  • 分析型智能体:通过自动补充研究背景,提供具有丰富情境支撑的深度洞察;

  • 决策辅助系统:针对各类“假设分析”场景,构建预测模型并呈现不同决策路径的潜在结果与权衡方案;

  • 智能数据工作流:自动诊断故障根本原因,并提供带有分步解决方案的推荐处理流程。


本文将带您逐步构建一个连接 Snowflake 的简易 AI 智能体——从架构设计到原型实现全程详解。


若您尚未拥有 Snowflake 账户,无需担心!您可通过此链接注册免费试用,立即获取功能完整的 Snowflake 实验环境。这将是在实战中构建专属 AI 智能体的绝佳方式。

什么是 AI 智能体,其独特之处何在?


在人工智能领域,AI 智能体的简明定义是:一种基于大语言模型的系统,能够:

  • 解析目标任务(例如“为我所在区域寻找 X 药物的临床试验”);

  • 制定实现目标的多步骤行动计划;

  • 调用诸如 Cortex Search(基于 RAG 的文档检索)或 Cortex Analyst(结构化数据检索)等工具,从 Snowflake 平台获取数据;

  • 评估执行结果并决策后续操作;

  • 根据反馈进行自适应迭代。


这与执行单一提示任务的简单大语言模型查询存在显著差异。单一提示任务仅具备有限或无历史交互记忆,且无法执行延伸操作。而 AI 智能体则能运用记忆存储、思维推理循环,有时还借助外部 API 接口来完成各类任务与流程。

Snowflake 智能体的架构


以下是原型智能体的一个基本架构视图:


[User Prompt(s)]     ↓[Agent Brain (LLM + Planner)]     ↓[Tool Execution Layer → Document Retrieval with RAG]     ↓[Result Interpreter]     ↓[Next Action Decision or Final Output]
复制代码


该智能体可调用的工具包括:

  • 面向 Snowflake 的文档检索类函数工具;

  • 数据解析与格式化处理工具;

  • 业务系统接口(包括 API、仪表盘及其他业务系统)。

构建您的第一个 AI 智能体——步骤指南


我们将基于 Snowflake 平台构建一个 AI 智能体。例如,我们将创建一个医疗健康智能体,该智能体能够通过查询数据库提供与临床试验相关问题的答案。

步骤 1:环境配置


为使 AI 智能体正常运行,我们需要为其提供知识库支持,这里我们将通过数据库访问的方式实现。为简化操作,请按以下步骤:在左侧导航栏中找到“Marketplace”,搜索“Clinical Trials Research Database”并下载该数据集。该数据库收录了由公共和私人资金支持的各类疾病与健康状况的临床试验记录。


要求:

  • Snowflake 账户:需拥有 Snowflake 的访问权限,且具备创建数据库、模式、表以及从 Snowflake Marketplace 获取数据的足够权限;

  • Cortex 服务访问权限:需获得 Snowflake Cortex 服务、Cortex 智能体、Cortex 搜索及 Cortex 分析功能的访问权限;

  • 将 Catalog > Database Explorer 中新增一个名为 “Data_Dispatch_agent” 的数据库,用于存储你的 Agent。

步骤 2:创建 AI 智能体


请导航至 AI&ML 模块并点击“Agents”开始构建您的 AI 智能体。


点击“创建智能体”。


暂时请勿勾选“为 Snowflake Intelligence 创建此智能体”选项,我们将在后续环节讨论该功能。当前阶段,我们只需让智能体专注于分析刚下载的数据库。


在“数据库与模式”下拉菜单中,选择您刚创建的数据库名称,并为智能体命名。例如,我将我的智能体命名为“Synapse”,这个医学术语寓意着信息的快速传递。


点击智能体名称并选择“编辑”,为其补充详细信息,例如添加关于智能体功能的描述说明!

修改智能体配置


为使 AI 智能体正常运行,您需要为其配置特定的工具来处理查询请求。在本案例中,我们将选择“临床试验研究数据库”作为数据源,并采用 CT(临床试验)模式。接着选取“临床试验搜索服务”作为功能组件。


 

我将“STUDY_URL”设为主键列,同时指定标题列后点击“添加”。返回主界面后保存智能体配置。该智能体将利用此列中的 URL 作为唯一标识符来识别和检索每行数据。当智能体发现与查询相关的信息时,会通过该 ID 精确定位源文档。标题列将作为界面显示文本,但需注意此处会显示完整 URL 而非可点击的超链接文本。您随时可以调整这种响应呈现方式。


对于 AI 智能体而言,“PubMed 生物医学研究文献库”是另一个值得配置的相关数据库,该资源同样可在 Snowflake 平台免费获取。根据个人对医学研究内容的偏好,我已将其添加至智能体配置中。该数据库的配置流程与前述临床试验数据库的操作步骤完全一致。

步骤 3:试用验证


您的 AI 智能体现已就绪,能够响应各类查询请求。


为进行测试,请尝试输入以下示例查询之一:


  • 目前有哪些正在招募患者的糖尿病临床试验?

  • 正在进行哪些类型的 GLP-1 临床试验?

  • 存在哪些用于衡量糖尿病相关总体趋势和数据的研究类型?

  • 成年人中葡萄膜炎的患病比例是多少?


请注意界面右上角的“显示轨迹”按钮。点击后可查看 AI 智能体生成响应所执行的各个步骤。您将观察到这并非简单的提示/响应交互,而是通过多轮搜索、规划响应优化流程,最终生成回答的完整过程。


 

此时点击您的 AI 智能体名称,界面右侧将展示其获取答案的详细处理流程。在返回最终响应前,AI 智能体的完整“思考”过程及最终响应结果均清晰可见。


工具


想让您的 AI 智能体更智能吗?您只需编辑智能体配置,进入“工具”菜单添加更多 Cortex 搜索服务或 Cortex Analyst 模型即可。


Cortex 搜索服务:将 AI 智能体连接到搜索服务,使其能够从非结构化数据源(如文档或会话记录)中检索信息。


Cortex Analyst(通过语义视图):添加语义视图可使 AI 智能体能够查询表格中的结构化数据。


请注意,在构建 AI 智能体时,您可以通过具体指令来控制其行为模式、语气和响应风格,使其符合您的偏好或期望的风格。例如,您可以让智能体以友好亲切的方式回应,或采用更具医学专家特色的专业语气!

控制智能体行为规范


即便是基础型 AI 智能体,若缺乏约束也可能产生偏离预期的行为。需通过明确设定背景语境和语气基调来定义智能体身份,并为应用程序提供上下文框架。


通过负面约束机制指导智能体规避特定行为,例如明确禁止其讨论某些敏感话题或访问特定类型数据。


确保智能体安全运行的方法还有很多,但这通常需要您对 Snowflake 平台进行一定程度的实践探索与技术熟悉。

未来发展方向


这仅仅是一个开始。从这里出发,您可以根据投入的时间让智能体向更智能、更精密的方向演进。以下是一些发展方向:

  • 添加前端界面(例如 Streamlit 或聊天机器人);

  • 构建面向营销、运营、财务等领域的垂直领域 AI 智能体;

  • 通过检索增强生成(RAG)技术对 AI 智能体进行微调。


智能体 AI 正在重塑数据处理方式。作为 Snowflake 开发者、合作伙伴或数据负责人,您现在已掌握超越仪表板的基础能力,能够构建自主化智能数据系统。


原文地址:https://www.linkedin.com/pulse/build-your-first-snowflake-agent-from-concept-prototype-7puac/



点击链接立即报名注册:Ascent - Snowflake Platform Training - China

2025-11-25 18:5810

评论

发布
暂无评论

软件测试 | Sonarqube中的覆盖率分析

测吧(北京)科技有限公司

测试

从传统数据库痛点看分布式数据库选型问题

OceanBase 数据库

户外led显示屏在安装设计指南

Dylan

LED显示屏 户外LED显示屏 户内led显示屏

sequence:从认识到会使用,今儿给你讲的透透的

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 3 月 PK 榜

企业是否具备等保测评资质在哪里查?怎么查?

行云管家

等保 等级保护 等保测评

软件测试 | Sonarqube scanner使用

测吧(北京)科技有限公司

测试

IntelliJ IDEA中提高代码开发效率的10个快捷操作

京东科技开发者

var java 企业号 3 月 PK 榜 psvm sout

基于 eBPF 的 Serverless 多语言应用监控能力建设

Serverless Devs

Serverless

面向增长,用友招聘云发布新一代人才配置解决方案!

用友BIP

人才 平台 招聘管理系统

2022 IoTDB Summit:京东刘刚《Apache IoTDB 在京东万物互联场景中的应用》

Apache IoTDB

大数据 时序数据库 IoTDB

用友BIP事项会计 X 全面预算:多维数智预算助力企业敏捷算赢未来

用友BIP

智能会计

软件测试 | Sonarqube架构

测吧(北京)科技有限公司

测试

flutter系列之:在flutter中自定义themes

程序那些事

flutter 架构 大前端 Web 程序那些事

秒懂算法 | 基于主成分分析法、随机森林算法和SVM算法的人脸识别问题

TiAmo

机器学习 算法 随机森林

零信任分段如何防止内网漫游?

权说安全

零信任

双机热备三个优势简单说明-行云管家

行云管家

负载均衡 高可用 服务器 双机热备

软件测试 | Sonarqube maven分析

测吧(北京)科技有限公司

测试

软件测试 | 代码分析的持续集成应用

测吧(北京)科技有限公司

测试

Node.js 未来发展趋势

京东科技开发者

Java 机器学习 前端 物联网 nodejs

2022 IoTDB Summit:长安汽车黄立《Apache IoTDB 在长安智能汽车数据平台的实践》

Apache IoTDB

高并发场景下,如何优化服务器的性能

华为云开发者联盟

高并发 开发 华为云 华为云开发者联盟 企业号 3 月 PK 榜

某游戏公司基于OceanBase 4.0的运营分析AP实践

OceanBase 数据库

详解Docker容器运行GUI程序的方法

华为云开发者联盟

开发 华为云 华为云开发者联盟 企业号 3 月 PK 榜

DockQuery x 达梦 国产数据库生态“加速跑”

BinTools图尔兹

#数据库 信创产业 达梦认证

一万年太久,只争朝夕 | Foundation model的进展仍不够快

Baihai IDP

人工智能 AI 大模型 企业号 3 月 PK 榜 Foundation Models

软件测试 | 常见覆盖率统计工具

测吧(北京)科技有限公司

测试

FTP上传文件速度太慢怎么办?

镭速

2023最新后端中大厂面经&在面试过程中如何反问?

王中阳Go

高效工作 学习方法 面试 面试题 大厂面经

从青铜到王者,揭秘 Serverless 自动化函数最佳配置

Serverless Devs

Serverless 云原生

软件测试 | 精准化测试

测吧(北京)科技有限公司

测试

2022 IoTDB Summit:中航王闯《Apache IoTDB 在中航机载智能云制造系统的应用解决方案》

Apache IoTDB

数据库 大数据 IoTDB

构建你的第一个 Snowflake 智能体:从概念到原型只需 3 步! | 技术实践_Snowflake_Snowflake_InfoQ精选文章