Vercel为多模型集成推出AI网关_后端_InfoQ精选文章

10 月 23 - 25 日，QCon 上海站即将召开，现在购票，享9折优惠了解详情 



 写点什么

登录/注册



大小：504.18K时长：02:52

Vercel为多模型集成推出AI网关

Vercel 推出了用于生产环境工作负载的AI网关。该服务提供了一个单一的 API 端点，用于访问范围广泛的大语言和生成式模型，旨在简化开发者的集成和管理。

AI网关允许应用程序通过一个端点向多个模型供应商发送推断请求。它支持自带密钥（bring-your-own-key）认证，这意味着开发者可以使用自己来自供应商（例如OpenAI、Anthropic或Google）的 API 密钥，而无需支付额外的令牌加价。网关还提供一致的请求路由，延迟低于 20 毫秒，旨在保持推断时间的稳定性，无需关心底层供应商的情况。

系统的核心功能之一是其故障转移机制。如果模型供应商遇到停机，网关会自动将请求重定向到可用的替代方案，减少服务中断。它还支持高请求吞吐，具备速率限制功能旨在满足生产级流量的需求。

可观测性内置于平台中。开发者可以访问详细的日志、性能指标和每个请求的成本跟踪信息。这些数据可以用来分析使用模式、监控响应时间，并了解不同模型供应商之间的成本分布，还可以使用AI SDK进行集成，在配置中指定模型标识符即可发出请求。

Vercle强调，AI网关已在内部使用，以运行v0.app，这是一个服务了数百万用户的服务。随着这次发布，基础设施对外部开发者开放，并针对生产工作负载进行了优化。

一个类似的服务是OpenRouter，它也提供了一个统一的接口给不同的 AI 模型供应商。OpenRouter 强调模型发现和跨供应商的价格透明度，Vercel 的 AI 网关则专注于低延迟路由、内置故障转移和与公司现有开发者工具和托管环境的集成。两项服务都旨在简化对多个模型的访问，但它们从不同的角度处理开发者体验和基础设施可靠性。

来自X和Reddit的开发者评论对其简单性和灵活性提出了表扬，同时也表达对免费层限制和特定模型集成的挫败感。

eToro 的技术负责人Filipe Sommer评论说：

太棒了！你能详细说明一下故障转移吗？在这个博客文章和文档中找不到太多信息。比如说，这是否意味着，当一个 Gemini 模型不可用时，它可以自动用另一个模型重试吗？

与此同时，AI 专家Himanshu Kumar评论说：

在优先考虑速度和可靠性的同时，使 AI 访问普及化——这是一个重大的进步。这可能会激发一波新的 AI 驱动应用。

开发者Melvin Arias提出了一个实际问题，询问：

它的定价与 openrouter 相比如何呢？

Vercel 的 AI 网关的正式发布将其定位为构建 AI 驱动应用的更广泛工具生态系统的一部分，重点是路由、可靠性和监控，而不是提供自己的专有模型。

原文链接：

Vercel Introduces AI Gateway for Multi-Model Integration

评论

发布

暂无评论

如何应用BI系统运营提效，一起看看瓴羊Quick BI的表现

对不起该用户已成仙‖

深圳.NET线下技术沙龙倒计时一天

MASA技术团队

Capital

学习进步笔记资源本质

想到哪说到哪的AI

PyTorch深度学习实战 | 基于ResNet的人脸关键点检测

深度学习人脸识别 PyTorch

内部开发者门户是什么？

微服务企业号 3 月 PK 榜内部开发者门户信息碎片化

"鸿蒙生态专家面对面"三月专场等你前来！

HarmonyOS开发者

李彦宏文心一言发布会 highlight

DevData Talks 直播预告 | 微众银行的研发效能实践有哪些经验？

思码逸研发效能

研发效能 DevData Talks

Next.js 实践：从 SSR 到 CSR 的优雅降级

React nextjs SSR

Toast的基本使用

android Adapter toast

如何测试一个AI系统？

设计模式-策略模式

设计模式策略模式

Go语言实现策略模式

NodeJS 实战系列：模块设计与文件分类

JavaScript node.js

聊聊「订单」业务的设计与实现

Java 架构订单管理订单系统订单

优秀软件工程师必备的五大技能，快看你还差什么？

飞算JavaAI开发助手

MongoDB源码学习：执行创建Collection命令

云里有只猫

mongodb 源码解析

低代码四大典型使用场景，你都知道吗？

飞算JavaAI开发助手

使用 Athena (Presto) 分析本地 Oracle 数据库导出的数据

亚马逊云科技 (Amazon Web Services）

openGemini正式加入openEuler DB SIG，携手开展全方面技术创新

华为云开源

时序数据库

GPT-4炸圈--多模态大模型

人工智能大模型 GPT ChatGPT GPT-4

百度生成式AI产品文心一言邀请测试，五大场景、五大能力革新生产力工具

飞桨PaddlePaddle

百度飞桨文心一言

在 windows 上连接 wsl 和直接打开 ubantu 有什么区别？

如何快速理解网络IO模型

Netty 事件循环 IO模型 Reactor多线程网络io模型

vivo 短视频用户访问体验优化实践

vivo互联网技术

CDN HTTP 优化 DNS 实践

Nacos心跳机制实现快速上下线

Java Spring Cloud nacos 心跳机制

使用价值三角方法来全方位分析产品

产品海豚湾

产品产品经理产品设计产品运营商业洞察

在追求卓越的路上，面对压力时，推荐你这二个做法。

Matlab常用图像处理命令108例（七）