写点什么

远程访问代理 + 内网穿透:火山引擎边缘网关助力自部署模型公网调用与全链路管控

  • 2025-05-14
    北京
  • 本文字数:2940 字

    阅读完需:约 10 分钟

大小:1.33M时长:07:44
远程访问代理+内网穿透:火山引擎边缘网关助力自部署模型公网调用与全链路管控

相比起三方提供商模型,自部署模型拥有数据主权、高度定制化、稳定性等优势,适合对于隐私性、垂直场景适配度和长期可控性都要求很高的业务。


今天分享一个超简单、实用的教程,无需任何代码,只需简单 4 步,就能快速通过火山引擎边缘大模型网关调用自部署模型。通过大模型网关实现内网穿透,提供对外域名访问能力,同时对自部署模型轻松实现鉴权、限流、安全、监控等能力!


第一步:添加自部署模型


第一步是将自部署模型添加到边缘大模型网关,这里的“自部署模型”指的是在自己管控的算力环境中私有化部署的模型,一般通过内网或公网提供服务。如果还在探索如何进行模型的本地化部署,下面提供一个通过 Ollama 部署模型的教程。


Ollama 是一个专为本地部署和管理大型语言模型(LLM)设计的开源框架。以部署 Deepseek-R1 模型为例,从  Ollama 官网下载安装包,用 pull 命令从在线模型库中选择 Deepseek-R1 进行下载,这一步需要考虑模型量化文件大小及计算机运行内存。在模型下载完成后,通过 Ollama 直接留空进入对话模式,用斜杠引出命令,或使用 API 方式进行访问即可在本地运行 Deepseek-R1。



将本地部署的 Deepseek-R1 命名为“私有化 Deepseek-R1”,这就是一个部署且运行在本地的私有化大模型了,不仅无需网络即可运行,还可以通过上传本地数据,打造属于自己的“知识库”。如果想通过边缘大模型网关调用“私有化 Deepseek-R1”,并进行全链路的管控,应该怎么操作呢?第一步就是添加自部署模型,以下是详细步骤:

  • 登录边缘大模型网关控制台(https://console.volcengine.com/vei/aigateway/overview),在左侧导航栏,选择模型配置管理>大模型管理。

  • 在自有三方模型标签页,单击自部署模型标签,单击添加模型。

  • 在添加模型对话框,完成以下参数配置:

    模型名称:为模型设置一个显示名称。

    调用名称:为模型设置一个标识符。只能使用字母、数字和下划线(_)。通过边缘大模型网关接口调用该模型时,模型调用请求中的 model 参数需传入您设置的模型标识符。

    模型系列:选择模型所属系列。

    提供商:仅支持自部署模型。

    模型格式:仅支持 OpenAI。

    模型类型:选择模型的类型。模型类型决定了模型的用量计量方式。您可以在类型选项上查看对应的计量方式(如 Chat 类型对应于 Token 用量)。支持多选,但只允许选择用量计量方式相同的多个类型。



对于仅支持内网访问的自部署模型,边缘大模型网关提供基于远程访问代理的内网穿透方案。您需要在本地或局域网内服务器上运行指定的代理工具(详见第二步),以将内网中的模型服务暴露给边缘大模型网关。


第二步:创建调用渠道


为使边缘大模型网关能够调用您的自部署模型,您需要提供模型的 API 密钥以建立调用渠道。有了 API 密钥,边缘大模型网关即可顺利访问并调用您的模型。

  • 登录边缘大模型网关控制台,在左侧导航栏,选择模型配置管理>大模型管理。

  • 在自有三方模型标签页,单击自部署模型标签,找到要使用的模型,单击创建调用渠道。

  • 在创建调用渠道对话框,完成以下参数配置,单击确定。

    渠道名称:为调用渠道设置一个显示名称。

    模型调用密钥:输入您在部署模型时设置的密钥。

    模型代理方式:选择一种访问代理模式。

    本机服务代理:适用于模型服务部署在本地计算机,只支持内网访问。该模式表示通过代理本地模型服务实现内网穿透,使本地模型服务可通过边缘大模型网关的公网域名远程访问。若选择该模式,

    需要设置本地端口号(指模型服务的端口)。

    在调用渠道创建成功后,您还必须在本地计算机上运行指定的代理工具。

  • 本地局域网服务代理:适用于模型服务部署在本地局域网内的某台服务器,只支持内网访问。该模式表示通过代理局域网内模型服务实现内网穿透,使局域网内模型服务可通过边缘大模型网关的公网域名远程访问。若选择该模式,

    需要设置 IP 地址(指模型服务器的内网 IP 地址)和端口号(指模型服务的端口)。

    在调用渠道创建成功后,您还必须在模型服务所在局域网内的任意一台服务器上运行指定的代理工具。

  • 域名代理:适用于通过公网域名访问模型服务的情形。若选择该模式,

  • 需要设置公网域名。公网域名必须是 OpenAI 兼容的 base url,例如 https://ark.cn-beijing.volces.com/api/v3。


在自部署模型列表,调用渠道数字表示一个自部署模型下已创建的调用渠道的数量。以上操作完成后,相应自部署模型的调用渠道数量会增加。您可以单击调用渠道数字,查看和管理(如编辑、删除)自部署模型下已添加的调用渠道。



安装代理工具(适用于本机服务代理或本地局域网代理模式)


如果调用渠道中的模型代理方式本机服务代理本地局域网代理,您必须在调用渠道创建成功后安装代理工具,否则边缘大模型网关无法访问您的模型。

  • 本机服务代理模式(参照以下步骤在本地计算机上安装并运行代理工具):

    单击调用渠道数字。

    在调用渠道面板,单击本机服务代理页签。

    找到调用渠道,单击操作列的获取代理工具。

    在弹出的获取代理工具提示框,单击复制。

    在本地计算机上打开命令行工具,运行复制的命令。



  • 本地局域网服务代理模式(参照以下步骤在模型服务所在局域网内的任意一台服务器上安装并运行代理工具):

    单击调用渠道数字。

    在调用渠道面板,单击本地局域网服务代理页签。

    找到调用渠道,单击操作列的获取代理工具。

    在弹出的获取代理工具提示框,单击复制。

    在局域网内任意一台服务器上打开命令行工具,运行复制的命令。


第三步:绑定调用渠道到网关访问密钥


要访问边缘大模型网关 API,您需要一个网关访问密钥。通过将您的模型调用渠道绑定到一个网关访问密钥,您就可以在使用此网关访问密钥时,选择指定模型作为被调用对象。您可以在创建网关访问密钥时绑定调用渠道,也可以编辑已有网关访问密钥来绑定新的调用渠道。

  • 登录边缘大模型网关控制台。

  • 在左侧导航栏,选择模型配置管理>大模型管理。

  • 在自有三方模型标签页,单击自部署模型标签,然后找到要使用的模型,单击操作列的创建网关访问密钥。

  • 完成创建网关访问密钥配置向导。 您可以参考创建网关访问密钥(https://www.volcengine.com/docs/6893/1324605)完成相关配置。需要注意的是,在模型选择区域,选择您创建的模型调用渠道,将它绑定到网关访问密钥。将提供商设置为自部署模型,可以筛选出可用的自部署模型调用渠道。



第四步:使用网关访问密钥


当您的网关访问密钥绑定了自部署模型调用渠道,您在获取此网关访问密钥对应的示例代码时,就可以选择指定模型作为被调用对象。将示例代码集成到您的业务逻辑后,您的边缘大模型网关请求将触发指定模型调用。


具体操作,请参见使用网关访问密钥(https://www.volcengine.com/docs/6893/1362929)。需要注意的是,当您查看示例代码时,在选择模型中选择您的自部署模型。



END


火山引擎边缘大模型网关采用基于远程访问代理的内网穿透方案,解决自部署模型公网访问难题。您只需在本地或局域网服务器上运行指定的代理工具,即可将自部署模型的访问请求转发至边缘大模型网关的公网域名,实现安全、便捷的远程访问。此外,边缘大模型网关还提供完善的鉴权、限流、安全防护和监控等功能,帮助您全面、精细地管理大模型应用落地,助力大模型应用的全生命周期管理。


点击链接https://console.volcengine.com/auth/login?redirectURI=%2Fvei%2Faigateway%2Foverview,登录边缘大模型网关控制台,4 步调用自部署模型,快来试试吧~

2025-05-14 10:134078

评论

发布
暂无评论

同城信息:微擎开源生态下的本地化生活服务

微擎应用市场

你真的会使用 Go 语言中的 Channel 吗?

左诗右码

七大技术路线解析:自动驾驶如何被数据重新定义

数据堂

人工智能 自动驾驶 AI 科普 训练数据

NoETL 指标平台:语义驱动数据治理的升维战

Aloudata

数据分析 数据治理 数据开发 指标平台 智能问数

AI 聊天应用的需求汇总10条

量贩潮汐·WholesaleTide

AI

程序员必备开发神器,建议火速收藏!!

飞算JavaAI开发助手

基于昇腾适配Meta AI在Science正刊发表的蛋白质结构预测模型ESMFold

Splendid2025

人工智能、

基于昇腾适配数据驱动的全球天气预报模型Fuxi

Splendid2025

人工智能「

认识 SwiftChat:一款跨平台、高性能的 AI 助手应用程序

亚马逊云科技 (Amazon Web Services)

AI 数据分析训练营第 1 期 -- 毕业总结

grandocean

《算法导论(第4版)》阅读笔记:p175-p181

codists

算法

AI Agent 的工程化被低估了

阿里巴巴云原生

现场大屏幕微擎开源生态下的智能现场互动中枢

微擎应用市场

Muu 云小店微擎生态下的轻量化电商

微擎应用市场

ArkUI-X构建Android平台AAR及使用

龙儿筝

探索 Pencils Swap 的叙事:为 DeFi 的再次爆发蓄力

加密眼界

夸克发布首个高考志愿大模型凭什么喊出“让天下没有难报的志愿”

脑极体

AI

华为Pura 80系列用户享Petal One三个月悦享套餐,6大会员权益一键领

最新动态

HarmonyOS运动开发:深度解析文件预览的正确姿势

王二蛋和他的张大花

DNS解析记录中的权重是什么意思?怎么配置权重?

国科云

大数据-11-MapReduce JOIN 操作的Java实现 Driver Mapper Reducer具体实现逻辑 模拟SQL进行联表操作

武子康

Java 大数据 hadoop mapreduce hive

四款国产远控软件,哪款适合我们应急办公使用?

科技热闻

工具分享-从ibd文件中恢复数据的神器ibd2sql

GreatSQL

Geneformer:基于Transformer的基因表达预测深度学习模型

Splendid2025

人工智能、

昇腾AI4S图机器学习:DGL消息传递接口的PyG替换

Splendid2025

AI开发最后一公里的神器,YouWare

大林

AI coding 氛围编程 AI 编程

寻疗微擎开源生态下的智慧医疗服务

微擎应用市场

壹佰智慧餐厅微擎生态下的餐饮数字化全场景解决方案

微擎应用市场

鸿蒙 UI 开发基础语法与组件复用全解析:从装饰器到工程化实践指南

谢道韫

基于昇腾适配DeepMind团队发布的蛋白质结构预测模型OpenFold

Splendid2025

人工智能、

探索OrcaMind.ai打造的链上AI操作系统,开启Web3新时代

加密眼界

远程访问代理+内网穿透:火山引擎边缘网关助力自部署模型公网调用与全链路管控_字节跳动_火山引擎_InfoQ精选文章