Agentic AI、具身智能、强化学习框架、端侧大模型……来QCon上海站,感受AI的未来! 了解详情
写点什么

Uber 创建镜像 OpenAI API 的 GenAI 网关,支持 60 多个 LLM 用例

作者:Rafal Gancarz

  • 2024-10-28
    北京
  • 本文字数:1070 字

    阅读完需:约 4 分钟

Uber 创建镜像 OpenAI API 的 GenAI 网关,支持 60 多个 LLM 用例

Uber 为服务外部供应商及自托管的大语言模型而创建的统一平台,为便于内部的采用而选择了镜像 OpenAI 的 API。GenAI 网关提供了一致且高效的接口,可为多个领域内的 60 多个不同的 LLM 用例提供服务。


Uber 是大语言模型(LLM)最早的一批采用者之一, 公司内有多个团队专注于将以 AI 驱动的功能融入到流程自动化、客户支持和内容生成等各个领域之中。然而,不同的集成类型也导致了工作的重复和方法的不统一。为应对这些挑战,Uber 决定将大模型相关的服务集中都在 GenAI 网关这一项服务中。


Uber 高级软件工程师 Tse-Chi Wang 和 Roopansh Bansal 解释了创建网关的原因:


GenAI 网关是为简化团队在项目中集成大模型的工作流程,简易的载入流程减少了团队的工作量,为利用大语言模型强大的功能提供了清晰且直接的途径。此外,工程安全团队所提供的标准化审核流程也会根据 Uber 的数据标准审查用例,审核通过才会允许用例访问网关。


出于 LangChain 和 LlamaIndex 等开源库的广泛采用和高可用性,Uber 团队选择在网关中使用 OpenAI API,通过镜像这一知名的应用程序接口可以简化载入的流程,扩大网关的负载范围。


GenIAI 网关是一项用 Go 语言编写的、位于服务层中的服务,结合了外部(OpenAI、Vertex AI)、内部的大语言模型和许多通用的能力(如验证和账户管理、缓存、可观测性和监控)。


GenAI 网关的架构图(来源:Uber Engineering Blog)


GenAI 网关可减少个人身份信息(PII),这对大语言模型来说不仅重要也是一项挑战。Uber 要在将请求转发至第三方供应商之前确保其中的 PII 数据是经过匿名处理的,从而避免敏感数据的暴露风险。但从另一方面来说,PII 的减少可能会导致请求中丢失重要上下文信息,从而让大语言模型无法提供有用的回复。此外,数据的减少对大语言模型的缓存和检索增强生成(RAG)来说也是个问题。为应对这些挑战,Uber 团队鼓励使用 Uber 托管的大语言模型或是考虑依赖第三方供应商提供的安全保障。


作者在这里提供了一个案例研究,通过为客服提供聊天内容总结,减少处理用户查询的时间,从而提高客服的运营效率。在这一案例中,大语言模型所生成的总结有 97% 被客服认为有用,用户查询时间缩短了 6 秒。目前该方案每周生成约 2,000 万份总结,Uber 团队计划将其扩展到更多的地区和使用类型中。


集成 GenAI 网关以支持特定用例(来源:Uber Engineering Blog)


Uber 团队从 GenAI 网关的开发和运行中学到了很多,并计划通过智能大模型缓存机制和更优秀的回滚逻辑、模型幻觉检测和安全策略维护进行改进。


查看英文原文

https://www.infoq.com/news/2024/09/uber-genai-gateway-llm-openai/

2024-10-28 08:083870

评论

发布
暂无评论
发现更多内容

风雨兼程,零代码训练营第四期顺利结业

明道云

小程序中如何显示Markdown文本

Changing Lin

10月月更

Linux开发coredump文件分析实战分享

良知犹存

Linux

阿里云云计算助理工程师认证(ACA)50个资源合集和备考题库 易筋 ARTS 打卡 Week 72

John(易筋)

ARTS 打卡计划

【LeetCode】合并两个有序链表Java题解

Albert

算法 LeetCode 10月月更

SpringBoot 实战:优雅的使用枚举参数(原理篇)

看山

Java Spring Boot Effective Spring 10月月更

数据库优化之explain 的使用和常用的SQL优化或索引优化

Regan Yue

数据库 数据库优化 Regan Yue 10月月更

5款良心工具,专治各种流氓顽固软件!

Jackpop

产品经理技能手册

俞凡

产品经理 产品管理 认知

别被vector最后一个元素erase错误

良知犹存

c++

【SpringCloud技术专题】「Hystrix源码」分析故障切换的运作流程

码界西柚

源码分析 SpringCloud Hystrix 熔断器 10月月更

v05.05 鸿蒙内核源码分析(任务管理) | 任务池是如何管理的 | 百篇博客分析 HarmonyOS 源码

鸿蒙研究站

HarmonyOS OpenHarmony 鸿蒙系统 任务队列

在开源项目或工作项目中使用git建立fork仓库

良知犹存

git

敬畏用户

FunTester

软件测试 测试 用户 FunTester 用户思维

一文带你盘点“微服务”中的技术点

Simon郎

微服务 Spring Cloud spring cloud alibaba java

马拉车算法,其实并不难!!!

秦怀杂货店

数据结构 算法 LeetCode

如何进行用户故事估算——Ethan分享观后感

Bruce Talk

敏捷 随笔 Agile User Story Product Owner

模块九作业

河马先生

架构实战营

stm32-HAL使用stop模式后DMA初始化的问题

良知犹存

stm32

业务中台数据一致性方案

慕枫技术笔记

后端 引航计划

模块九毕业设计

以吻封笺

k8s replicaset controller源码分析(1)-初始化与启动分析

良凯尔

Kubernetes 源码分析 Kubernetes源码 #Kubernetes#

模块9

Geek_ywh40v

stm32-HAL使用usart发送中断判断发送标志库问题

良知犹存

stm32

技术公众号小白互助网络

Felix

GitHub 微信公众号 自媒体

模块九作业:设计电商秒杀系统

Felix

校友录小程序开发笔记三十一:校庆模块设计与实现

CC同学

012云原生之微服务

穿过生命散发芬芳

云原生 10月月更

产品经理职业发展框架

俞凡

产品经理 产品管理 认知

iOS开发独家秘籍-代码块Code Snippets

iOSer

ios 代码 ios开发

大神Jeff Dean相关的一些项目

春秋易简

Uber 创建镜像 OpenAI API 的 GenAI 网关,支持 60 多个 LLM 用例_AI 工程化_InfoQ精选文章