时隔16年Jeff Barr重返10.23-25 QCon上海站,带你看透AI如何重塑软件开发! 了解详情
写点什么

Vercel 为多模型集成推出 AI 网关

作者:Daniel Dominguez

  • 2025-09-16
    北京
  • 本文字数:1002 字

    阅读完需:约 3 分钟

大小:504.18K时长:02:52
Vercel为多模型集成推出AI网关

Vercel 推出了用于生产环境工作负载的AI网关。该服务提供了一个单一的 API 端点,用于访问范围广泛的大语言和生成式模型,旨在简化开发者的集成和管理。

 

AI网关允许应用程序通过一个端点向多个模型供应商发送推断请求。它支持自带密钥(bring-your-own-key)认证,这意味着开发者可以使用自己来自供应商(例如OpenAIAnthropicGoogle)的 API 密钥,而无需支付额外的令牌加价。网关还提供一致的请求路由,延迟低于 20 毫秒,旨在保持推断时间的稳定性,无需关心底层供应商的情况。

 

系统的核心功能之一是其故障转移机制。如果模型供应商遇到停机,网关会自动将请求重定向到可用的替代方案,减少服务中断。它还支持高请求吞吐,具备速率限制功能旨在满足生产级流量的需求。

 

可观测性内置于平台中。开发者可以访问详细的日志、性能指标和每个请求的成本跟踪信息。这些数据可以用来分析使用模式、监控响应时间,并了解不同模型供应商之间的成本分布,还可以使用AI SDK进行集成,在配置中指定模型标识符即可发出请求。

 

Vercle强调,AI网关已在内部使用,以运行v0.app,这是一个服务了数百万用户的服务。随着这次发布,基础设施对外部开发者开放,并针对生产工作负载进行了优化。

 

一个类似的服务是OpenRouter,它也提供了一个统一的接口给不同的 AI 模型供应商。OpenRouter 强调模型发现和跨供应商的价格透明度,Vercel 的 AI 网关则专注于低延迟路由、内置故障转移和与公司现有开发者工具和托管环境的集成。两项服务都旨在简化对多个模型的访问,但它们从不同的角度处理开发者体验和基础设施可靠性。

 

来自XReddit的开发者评论对其简单性和灵活性提出了表扬,同时也表达对免费层限制和特定模型集成的挫败感。

 

eToro 的技术负责人Filipe Sommer评论说:

太棒了!你能详细说明一下故障转移吗?在这个博客文章和文档中找不到太多信息。比如说,这是否意味着,当一个 Gemini 模型不可用时,它可以自动用另一个模型重试吗?

 

与此同时,AI 专家Himanshu Kumar评论说:

在优先考虑速度和可靠性的同时,使 AI 访问普及化——这是一个重大的进步。这可能会激发一波新的 AI 驱动应用。

 

开发者Melvin Arias提出了一个实际问题,询问:

它的定价与 openrouter 相比如何呢?

 

Vercel 的 AI 网关的正式发布将其定位为构建 AI 驱动应用的更广泛工具生态系统的一部分,重点是路由、可靠性和监控,而不是提供自己的专有模型。

 

原文链接:

Vercel Introduces AI Gateway for Multi-Model Integration

2025-09-16 11:063781

评论

发布
暂无评论

建木持续集成平台v2.3.1发布

Jianmu

开源 DevOps 自动化 持续集成 gitops

华创视讯加入龙蜥社区,携手共建开源新生态

OpenAnolis小助手

开源 龙蜥社区 CLA 华创视讯 龙腾计划

渗透测试工具一一Nmap(从初级到高级)

网络安全学海

网络安全 渗透测试 WEB安全 漏洞挖掘 nmap

遇到bug怎么分析,这篇文章值得一看

伤心的辣条

Python 程序人生 软件测试 自动化测试 测试开发

Hadoop hdfs 的shell操作

Emperor_LawD

hadoop Shell 5月月更

【愚公系列】2022年05月 二十三种设计模式(七)-桥接模式(Bridge Pattern)

愚公搬代码

5月月更

一个小操作,SQL查询速度翻了1000倍。

TiDB 社区干货传送门

行业案例| MongoDB在腾讯零售优码中的应用

MongoDB中文社区

mongodb

基调听云研发总监杨金全出席CSDN可观测性与APM峰会

基调听云

云原生 APM 可观测性 基调听云

从活动能力层建设看业务架构

Qunar技术沙龙

业务架构

飞桨云上沙龙——智能制造专场

百度大脑

区块链系统开发,交易所交易平台搭建

Geek_56201b

技术干货| MongoDB如何查询Null或不存在的字段?

MongoDB中文社区

mongodb

gRPC服务开发和接口测试初探【Go】

FunTester

信息系统的建设周期

奔向架构师

信息系统 5月月更

模块一

Geek_28cf33

企评家|华润三九医药股份有限公司成长性评价报告摘要

企评家

塔米狗企评家 企业评价 企业成长性分析 企评家 企业投资价值评价

LabVIEW仪器控制:智能示波器(普源DS1000E)

不脱发的程序猿

LabVIEW 串口通信 VISA LabVIEW示波器软件

疫情时代如何提高办公效率?

小炮

Redis命令HSCAN踩坑指南

Qunar技术沙龙

dba

从手工测试到自动化测试进阶,需要学什么?结合自身分享我10+年的测试经验!

伤心的辣条

Python 程序人生 软件测试 自动化测试 接口测试

Mysql的事务操作问题

恒山其若陋兮

MySQL 5月月更

观测云产品更新|优化观测云商业版升级流程;新增进程、日志、链路详情页关联网络;场景模块优化等

观测云

运维 可观测性 可观测

去哪儿网MySQL日志分析实践,80%数据丢失都给你救回来!

Qunar技术沙龙

dba

恒源云 (Gpushare)_Restormer:用于高分辨率图像重建的高效Transformer

恒源云

人工智能 深度学习 Transformer

Java中容易混淆的基础知识

工程师日月

java 5月月更

虎符交易所Hoo研究院|币海寻珠 2022年4月下半月区块链投融事件TOP20

区块链前沿News

虎符研究院

Flutter 组件渲染模式详解

岛上码农

flutter ios 安卓开发 跨平台应用 5月月更

解决方案| 阿里云数据库MongoDB版助力餐道显著提升运维效率,打造卓越餐饮/零售服务

MongoDB中文社区

mongodb

TiKV 缩容不掉如何解决?

TiDB 社区干货传送门

在基础语法中Java与c++有哪些不同?(对于学过c++转Java必看)

工程师日月

c++ java 5月月更

Vercel为多模型集成推出AI网关_后端_InfoQ精选文章