2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

Dev Proxy v0.28 为 LLM 使用和成本分析引入了遥测技术

作者:Almir Vuk

  • 2025-06-17
    北京
  • 本文字数:1269 字

    阅读完需:约 4 分钟

大小:617.88K时长:03:30
Dev Proxy v0.28为LLM使用和成本分析引入了遥测技术

.NET 团队发布了Dev Proxy 0.28版本,引入了新功能以提高可观测性、插件可扩展性以及与 AI 模型的集成。这次发布的核心特性是OpenAITelemetryPlugin,据报道,它允许开发者在其应用程序中跟踪 OpenAI 和 Azure OpenAI 语言模型请求的使用情况和估计成本。

 

该插件拦截请求并记录详细信息,如使用的模型、token 计数(提示、完成和总数)、每个请求的成本估计以及每个模型的汇总摘要。

 

根据公告,这个插件支持更深入地了解应用程序如何与大语言模型(LLM)交互,可以使用 OpenLIT 等外部工具进行可视化,以了解使用的模式并优化与 AI 相关的费用。

 

该更新还支持微软的Foundry Local,这是一个在上个月的 Build 大会上推出的高性能本地 AI 运行时堆栈。Foundry Local 使开发者能够将基于云的 LLM 调用重定向到本地环境,从而降低成本并实现离线开发。

 

正如声明中所说,Dev Proxy 现在可以配置为使用本地模型,引用开发团队的以下说法:

 

我们的初步测试显示,与过去使用的其他模型相比,在 Foundry Local 上使用 Phi-4 mini 取得了显著改进。我们计划在未来版本的 Dev Proxy 中默认集成 Foundry Local。

 

要用 Foundry Local 配置 Dev Proxy,开发者可以在代理的配置文件的语言模型部分指定本地模型和端点。这种集成为在本地开发中使用 LLM 的开发者提供了一种成本效益高的替代方案。

 

对于.NET Aspire用户,现在有一个 Dev Proxy 扩展的预览版本可用。这些扩展简化了与 Aspire 应用程序的集成,允许 Dev Proxy 以最小的设置在本地或通过 Docker 运行。据报道,这种增强提高了可移植性,并简化了分布式开发团队的配置过程。

 

此外,还扩展了对 OpenAI 有效负载的支持。正如声明中所说,以前 Dev Proxy 仅限于文本补全,现在包括对更广泛的补全类型的支持,增加了与 OpenAI API 的兼容性。

 

此次发布还带来了TypeSpec生成的增强。与 TypeSpec v1.0 的更新一致,插件现在支持改进的 PATCH 操作生成,使用 MergePatchUpdate 来明确定义合并补丁行为。

 

正如发布中所指出的,Dev Proxy 现在支持所有配置文件中的 JSONC(带注释的 JSON)。这个新增功能使开发者能够添加内联文档和注释,这有助于团队协作和长期维护。

 

在日志记录和模拟方面也进行了并发性改进。这些更改确保了并行请求的日志被准确分组,帮助开发者更有效地追踪请求行为。

 

此次发布包括两个重大的变更。首先,GraphConnectorNotificationPlugin 已被移除,因为微软团队已经不支持使用 GraphConnectorNotificationPlugin。

 

此外,在 devproxy jwt create 命令中的--audience 标志已被重命名为--audiences,而简写别名-a 保持不变。

 

CRUD API 插件已更新,改进了 CORS 处理和一致的 JSON 响应,增强了其在客户端应用程序中的可靠性。

 

最后,Dev Proxy Toolkit for Visual Studio Code已更新至版本 0.24.0。此次发布引入了新的代码片段和命令,包括对已提及的 OpenAITelemetryPlugin 的支持,也改进了 Dev Proxy Beta 的兼容性,以及更好的进程检测。

 

对此感兴趣的读者,可以在官方存储库中获得完整的发布说明,其中提供了这个版本的特性、更改和指导的完整概览。

 

原文链接:

https://www.infoq.com/news/2025/06/microsoft-dev-proxy-v28/

2025-06-17 13:001

评论

发布
暂无评论

区块链,开启智慧养老新时代

CECBC

预付式消费不安全怎么办?区块链技术来了

CECBC

Flexagile 弹性敏捷 - 理论篇

RingCentral铃盛

Flexagile

Go+ HTTP 客户端教程(5.1)

liuzhen007

28天写作 12月日更

CSS之选择器(三)

Augus

CSS 12月日更

实用机器学习笔记十:机器学习模型

打工人!

AI 算法 学习笔记 机器学习算法 12月日更

MySql优化:详细解读InnoDB存储引擎

秋水

MySQL性能优化 内容合集 签约计划第二季 MySQL InnoDB

dart系列之:实时通讯,在浏览器中使用WebSockets

程序那些事

flutter dart HTTP 程序那些事 12月日更

模块二作业

Geek_e6f7f6

架构训练营

电商系统微服务架构设计

天天向上

架构实战营

我们需要一个React框架吗?

RingCentral铃盛

React 框架 分布式应用框架

字典树之旅03.Patricia Trie(一)

极客志

Java 自然语言处理 数据结构 算法 字典树

Flexagile 弹性敏捷 - 文化篇

RingCentral铃盛

回家

Tiger

28天写作

Gbase8a MPP Cluster 集群管理

南渡北归

gbase8a gbase8a集群管理 gcadmin

Servlet的生命周期

JavaEdge

12月日更

Android C++系列:Linux网络(四)TCP详解

轻口味

c++ android 28天写作 12月日更

Deutsch-Jozsa Algorithm

Si Yuan

量子计算

通过接口百度网盘下载文件

为自己带盐

28天写作 百度网盘 12月日更

架构实战 - 模块六

唐敏

「架构实战营」

聊聊SpringBoot中的两种占位符:@*@ 和 ${*}

xiaoxi666

maven springboot

Linux之cd命令

入门小站

目录

WebP,淘宝都在用的图片优化方法

CRMEB

在 Dart(以及 Flutter)中生成随机字符串的 3 种不同方法【Flutter专题21】

坚果

flutter 28天写作 12月日更

图解 Volatile 原理三

悟空聊架构

volatile 28天写作 悟空聊架构 12月日更 嗅探

Quantum Mechanics Is Different

Si Yuan

量子计算

在线JSON转Go Bson工具

入门小站

工具

2021,自动驾驶的“五代十国”

脑极体

成年人除了工作以外,在社会上还要争取什么?

DaemonStone

管理 技术人生 职业发展 人生选择

HHL Algorithm

Si Yuan

量子计算

Flexagile 弹性敏捷 - 实践篇

RingCentral铃盛

Dev Proxy v0.28为LLM使用和成本分析引入了遥测技术_AI&大模型_InfoQ精选文章