写点什么

Dev Proxy v0.28 为 LLM 使用和成本分析引入了遥测技术

作者:Almir Vuk

  • 2025-06-17
    北京
  • 本文字数:1269 字

    阅读完需:约 4 分钟

大小:617.88K时长:03:30
Dev Proxy v0.28为LLM使用和成本分析引入了遥测技术

.NET 团队发布了Dev Proxy 0.28版本,引入了新功能以提高可观测性、插件可扩展性以及与 AI 模型的集成。这次发布的核心特性是OpenAITelemetryPlugin,据报道,它允许开发者在其应用程序中跟踪 OpenAI 和 Azure OpenAI 语言模型请求的使用情况和估计成本。

 

该插件拦截请求并记录详细信息,如使用的模型、token 计数(提示、完成和总数)、每个请求的成本估计以及每个模型的汇总摘要。

 

根据公告,这个插件支持更深入地了解应用程序如何与大语言模型(LLM)交互,可以使用 OpenLIT 等外部工具进行可视化,以了解使用的模式并优化与 AI 相关的费用。

 

该更新还支持微软的Foundry Local,这是一个在上个月的 Build 大会上推出的高性能本地 AI 运行时堆栈。Foundry Local 使开发者能够将基于云的 LLM 调用重定向到本地环境,从而降低成本并实现离线开发。

 

正如声明中所说,Dev Proxy 现在可以配置为使用本地模型,引用开发团队的以下说法:

 

我们的初步测试显示,与过去使用的其他模型相比,在 Foundry Local 上使用 Phi-4 mini 取得了显著改进。我们计划在未来版本的 Dev Proxy 中默认集成 Foundry Local。

 

要用 Foundry Local 配置 Dev Proxy,开发者可以在代理的配置文件的语言模型部分指定本地模型和端点。这种集成为在本地开发中使用 LLM 的开发者提供了一种成本效益高的替代方案。

 

对于.NET Aspire用户,现在有一个 Dev Proxy 扩展的预览版本可用。这些扩展简化了与 Aspire 应用程序的集成,允许 Dev Proxy 以最小的设置在本地或通过 Docker 运行。据报道,这种增强提高了可移植性,并简化了分布式开发团队的配置过程。

 

此外,还扩展了对 OpenAI 有效负载的支持。正如声明中所说,以前 Dev Proxy 仅限于文本补全,现在包括对更广泛的补全类型的支持,增加了与 OpenAI API 的兼容性。

 

此次发布还带来了TypeSpec生成的增强。与 TypeSpec v1.0 的更新一致,插件现在支持改进的 PATCH 操作生成,使用 MergePatchUpdate 来明确定义合并补丁行为。

 

正如发布中所指出的,Dev Proxy 现在支持所有配置文件中的 JSONC(带注释的 JSON)。这个新增功能使开发者能够添加内联文档和注释,这有助于团队协作和长期维护。

 

在日志记录和模拟方面也进行了并发性改进。这些更改确保了并行请求的日志被准确分组,帮助开发者更有效地追踪请求行为。

 

此次发布包括两个重大的变更。首先,GraphConnectorNotificationPlugin 已被移除,因为微软团队已经不支持使用 GraphConnectorNotificationPlugin。

 

此外,在 devproxy jwt create 命令中的--audience 标志已被重命名为--audiences,而简写别名-a 保持不变。

 

CRUD API 插件已更新,改进了 CORS 处理和一致的 JSON 响应,增强了其在客户端应用程序中的可靠性。

 

最后,Dev Proxy Toolkit for Visual Studio Code已更新至版本 0.24.0。此次发布引入了新的代码片段和命令,包括对已提及的 OpenAITelemetryPlugin 的支持,也改进了 Dev Proxy Beta 的兼容性,以及更好的进程检测。

 

对此感兴趣的读者,可以在官方存储库中获得完整的发布说明,其中提供了这个版本的特性、更改和指导的完整概览。

 

原文链接:

https://www.infoq.com/news/2025/06/microsoft-dev-proxy-v28/

2025-06-17 13:003515

评论

发布
暂无评论

YashanDB数据库故障诊断与恢复策略解析

数据库砖家

YashanDB数据库架构设计中的关键考量因素

数据库砖家

会议室无缝LED视频墙:高效沟通

Dylan

会议室 LED display LED显示屏 投影仪 LED屏幕

如何通过Python SDK 获取Collection

DashVector

人工智能 数据库 AI 向量检索 大模型

YashanDB数据库故障恢复与备份最佳实践

数据库砖家

YashanDB数据库缓存机制及快速访问优化技巧

数据库砖家

YashanDB数据库缓存优化策略及实践

数据库砖家

YashanDB数据库架构设计最佳实践教程

数据库砖家

《烟草行政处罚案卷制作与评查平台研发纪实》,深度剖析精益求精的背后历程

中烟创新

9个CST电磁仿真软件电路获取S参数的方法

思茂信息

cst cst仿真软件 CST软件

YashanDB数据库集群容灾恢复设计

数据库砖家

搞懂 ELK 日志系统架构,这一篇就够了(含实战图解)

左诗右码

YashanDB数据库故障诊断及自动恢复技术

数据库砖家

YashanDB数据库集群性能调优指南

数据库砖家

超融合选型避坑指南:为什么说 VMware 替代方案更具“长期性价比”

智驱前线

企业内网即时通讯软件,怎样的软件适合企业使用?

BeeWorks

即时通讯 IM 私有化部署

详细教程:如何利用nslookup命令查询DNS解析状态?

防火墙后吃泡面

YashanDB数据库故障恢复自动化流程分享

数据库砖家

YashanDB数据库集成AI技术提升智能分析能力

数据库砖家

YashanDB数据库技术创新带来的行业变革与未来展望

数据库砖家

构建 AI 智能体的实用开源技术栈(框架、计算机与浏览器操控、语音功能、文档理解...)

Baihai IDP

人工智能 AI 智能体 LLM AI Agent

YashanDB数据库管理系统升级与迁移实战教程

数据库砖家

YashanDB数据库缓存机制的工作原理介绍

数据库砖家

首届AI国际人才峰会启幕,智源携手港投公司共筑青年创新生态

智源研究院

人工智能

从零构建AI测试平台:文档解析与知识库构建全解析

测试人

YashanDB数据库故障诊断与快速修复指南

数据库砖家

TinyEngine 2.8 正式上线:AI能力就位、Docker一键起飞!

OpenTiny社区

开源 前端 低代码

YashanDB数据库故障自动修复机制详解

数据库砖家

区块链RWA系统的资产标准化

北京木奇移动技术有限公司

区块链开发 软件外包公司 RWA开发

YashanDB数据库集群故障诊断及恢复实战

数据库砖家

企业为什么内部要用专业的即时通讯工具?BeeWorks总结这几点

BeeWorks

即时通讯 IM 私有化部署

Dev Proxy v0.28为LLM使用和成本分析引入了遥测技术_AI&大模型_InfoQ精选文章