写点什么

Uber 创建镜像 OpenAI API 的 GenAI 网关,支持 60 多个 LLM 用例

作者:Rafal Gancarz

  • 2024-10-28
    北京
  • 本文字数:1070 字

    阅读完需:约 4 分钟

Uber 创建镜像 OpenAI API 的 GenAI 网关,支持 60 多个 LLM 用例

Uber 为服务外部供应商及自托管的大语言模型而创建的统一平台,为便于内部的采用而选择了镜像 OpenAI 的 API。GenAI 网关提供了一致且高效的接口,可为多个领域内的 60 多个不同的 LLM 用例提供服务。


Uber 是大语言模型(LLM)最早的一批采用者之一, 公司内有多个团队专注于将以 AI 驱动的功能融入到流程自动化、客户支持和内容生成等各个领域之中。然而,不同的集成类型也导致了工作的重复和方法的不统一。为应对这些挑战,Uber 决定将大模型相关的服务集中都在 GenAI 网关这一项服务中。


Uber 高级软件工程师 Tse-Chi Wang 和 Roopansh Bansal 解释了创建网关的原因:


GenAI 网关是为简化团队在项目中集成大模型的工作流程,简易的载入流程减少了团队的工作量,为利用大语言模型强大的功能提供了清晰且直接的途径。此外,工程安全团队所提供的标准化审核流程也会根据 Uber 的数据标准审查用例,审核通过才会允许用例访问网关。


出于 LangChain 和 LlamaIndex 等开源库的广泛采用和高可用性,Uber 团队选择在网关中使用 OpenAI API,通过镜像这一知名的应用程序接口可以简化载入的流程,扩大网关的负载范围。


GenIAI 网关是一项用 Go 语言编写的、位于服务层中的服务,结合了外部(OpenAI、Vertex AI)、内部的大语言模型和许多通用的能力(如验证和账户管理、缓存、可观测性和监控)。


GenAI 网关的架构图(来源:Uber Engineering Blog)


GenAI 网关可减少个人身份信息(PII),这对大语言模型来说不仅重要也是一项挑战。Uber 要在将请求转发至第三方供应商之前确保其中的 PII 数据是经过匿名处理的,从而避免敏感数据的暴露风险。但从另一方面来说,PII 的减少可能会导致请求中丢失重要上下文信息,从而让大语言模型无法提供有用的回复。此外,数据的减少对大语言模型的缓存和检索增强生成(RAG)来说也是个问题。为应对这些挑战,Uber 团队鼓励使用 Uber 托管的大语言模型或是考虑依赖第三方供应商提供的安全保障。


作者在这里提供了一个案例研究,通过为客服提供聊天内容总结,减少处理用户查询的时间,从而提高客服的运营效率。在这一案例中,大语言模型所生成的总结有 97% 被客服认为有用,用户查询时间缩短了 6 秒。目前该方案每周生成约 2,000 万份总结,Uber 团队计划将其扩展到更多的地区和使用类型中。


集成 GenAI 网关以支持特定用例(来源:Uber Engineering Blog)


Uber 团队从 GenAI 网关的开发和运行中学到了很多,并计划通过智能大模型缓存机制和更优秀的回滚逻辑、模型幻觉检测和安全策略维护进行改进。


查看英文原文

https://www.infoq.com/news/2024/09/uber-genai-gateway-llm-openai/

2024-10-28 08:083666

评论

发布
暂无评论
发现更多内容

Spark Shuffle 内部机制(二)

hanke

大数据 spark 开源

Spring常用注解

ES_her0

28天写作

真正的勇士,敢于重新开始,敢于再次开始😂

Nydia

ConcurrentBag 听过没?好家伙高并发知识点十分密集!一种并发优化思路!

yes

Java 面试 并发

第五章作业

Kalman

产品经理 产品经理训练营

Python基础之:数字字符串和列表

程序那些事

Python 字符串 Python基础 Python3 程序那些事

Impala 3.4在网易的最新实践

DataFunTalk

玩转写作平台-公众号文章出圈福利~

InfoQ写作社区官方

InfoQ 玩转写作平台 出圈攻略

产品训练营第四章作业(二)

Arnold

2020-我的技术之路:创业公司中的研发效能与技术赋能

王下邀月熊

大前端 后端 2020年总结

Elasticsearch 组合查询

escray

elastic 七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 2月春节不断更

(干货)玩转写作平台 - 优质作者推荐几大法则!!

InfoQ写作社区官方

InfoQ 玩转写作平台 上线规则

常用的Date与LocalDate转换工具

废材姑娘

Java

LeetCode题解:213. 打家劫舍 II,动态规划(缓存偷盗状态),JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

窥探未来不是梦,python数据分析轻松实现

小Q

Python 学习 编程 面试 数据分析

工作日志-2-22

技术骨干

Eclipse快捷键大全

lnngle

Java eclipse 快捷键

面试系列一:精选大数据面试真题10道(混合型)-附答案详细解析

五分钟学大数据

大数据 面试 28天写作

基于matlab的控制系统与仿真1-传递函数图像的绘制

AXYZdong

matlab 2月春节不断更

(干货)玩转写作平台-优质文章推荐五大爆点!

InfoQ写作社区官方

InfoQ 玩转写作平台 上线规则

青帮大佬杜月笙的另一面及其后代现状

wbliu85

梦境交互:做个现代灵媒,考虑一下?

脑极体

产品经理是吃青春饭的吗?

涛哥 数字产品和业务架构

产品经理

音频社交的变声,应用了哪些算法?

拍乐云Pano

RTC 语音聊天室 clubhouse 音频社交 变声

Selenium 八大定位,滚雪球学 Python 番外系列

梦想橡皮擦

Python 28天写作 2月春节不断更

week13作业

zbest

LeetCode 采坑两次后,我终于学会了 BFS

与你一起学算法

Python BFS 数据结构与算法

记一次独角兽公司双系统迁移合并解决方案

架构

如何在2021金三银四拿到35K,我肝了这份10W字Java面试手册送给大家

程序员 架构 面试

Git 教程--git stash命令

生之欢愉,时间同行

git 程序员 git stash

第五章学习总结

Kalman

产品经理 产品经理训练营

Uber 创建镜像 OpenAI API 的 GenAI 网关,支持 60 多个 LLM 用例_AI 工程化_InfoQ精选文章