2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

模型测试不再跳来跳去,VS Code + Hugging Face = 真香

作者:Robert Krzaczyński

  • 2025-09-19
    北京
  • 本文字数:989 字

    阅读完需:约 3 分钟

大小:479.29K时长:02:43
模型测试不再跳来跳去,VS Code + Hugging Face = 真香

Hugging Face 发布新功能,让开发者可在 VS Code 的 GitHub Copilot Chat 中直接接入 Inference Providers。借助这一更新,Kimi K2、DeepSeek V3.1、GLM 4.5 等开源大语言模型如今可以直接在 VS Code 编辑器内调用和测试,开发者无需再频繁切换平台或工具。


整个工作流程设计得非常简洁。开发者只需安装 Hugging Face Copilot Chat 插件,打开 VS Code 的聊天界面,选择 Hugging Face 提供方,输入 Hugging Face 的 token,然后添加想要使用的模型。完成连接后,便可以通过熟悉的模型选择器在不同提供方和模型之间自由切换。


社区很快注意到一个细节:这一功能需要最新版的 VS Code 支持。正如 AI 研究员 Aditya Wresniyandaka 在 LinkedIn 上指出的:

文档里没写:这个集成并不是所有版本都支持,你得升级到 2025 年 8 月的 VS Code 1.104.0 才行。


长期以来,GitHub Copilot Chat 一直依赖封闭的专有模型。此次与 Hugging Face Inference Providers 网络的打通,让开发者能够使用更多类型的 AI 工具,包括实验性和高度专业化的开源模型。


Muhammad Arshad Iqbal 则兴奋地评价道:

喜欢这个更新!我们现在可以在 VS Code 里直接用那些开源的 AI 编程助手,再也不用为了试试 Qwen3-Coder 这种模型而来回切换窗口了。


这项集成为开发者打开了更多可能性,他们能够在 Copilot Chat 中调用针对特定编程任务、行业或研究领域优化的模型,而不再局限于默认选项。这一功能由 Hugging Face Inference Providers 服务提供支持,开发者只需一个统一 API 就能访问数百种机器学习模型。


这项服务的最大价值在于“统一”:开发者不必再处理多个 API 的差异和不稳定性,而是能通过一致的接口调用来自不同提供方的模型。Hugging Face 特别强调了几大优势:

  1. 即时访问最前沿的模型,远超单一厂商目录能提供的范围。

  2. 避免厂商锁定,开发者几乎无需修改代码就能自由切换提供方。

  3. 面向生产环境的性能保障,提供高可用性和低延迟推理。

  4. 为开发者提供便捷的集成方式,可直接兼容 OpenAI Chat Completions API,并附带 Python 与 JavaScript 客户端 SDK。


在定价方面,Hugging Face 也尽量降低门槛。开发者每月可获得一定的免费推理额度,Pro、Team 和 Enterprise 用户则可享受更大容量及按需付费的灵活方案。Hugging Face 强调,开发者支付的费用与模型提供方实际收费完全一致,不会额外加价。


原文链接:

https://www.infoq.com/news/2025/09/hugging-face-vscode/

2025-09-19 14:306403

评论

发布
暂无评论

大厂算法面试之leetcode精讲10.递归&分治

全栈潇晨

LeetCode 算法面试

Elasticsearch云生态下的开源共生之路

大咖说

云计算 elasticsearch 开源

Python量化数据仓库搭建系列2:Python操作数据库

恒生LIGHT云社区

Python 量化

数仓开发详细剖析

五分钟学大数据

11月日更

微博评论架构分析

小麦🌾

架构实战营

16张图解锁Spring的整体脉络

4ye

Java spring 程序员 后端 签约计划第二季

react源码解析4.源码目录结构和调试

buchila11

React React Hooks

Linux学习方法《Linux一学就会》Centos8软件包的管理与安装

侠盗安全

Linux linux运维 运维工程师 云计算架构师

爱奇艺TFServing负载均衡问题研究及改进实践

爱奇艺技术产品团队

如何使用 Java 代码给图片增加倒影效果

汪子熙

Java API 图片处理 11月日更 Java图片

Perforce用户文章转载:每个游戏从业者都应该学学P4

龙智—DevSecOps解决方案

版本控制 游戏开发 版本管理 perforce 游戏厂商

阿里云 Serverless 助力企业全面拥抱云原生

阿里巴巴云原生

阿里云 Serverless 云原生 企业

应对 Job 场景,Serverless 如何帮助企业便捷上云

阿里巴巴云原生

阿里云 Serverless 云原生 函数 Job

云原生体系下 Serverless 弹性探索与实践

阿里巴巴云原生

阿里云 Serverless 云原生 弹性 SAE

直播预告|数以智用——大数据应用探索与实践

智联卓聘

大数据 数据管理 线上沙龙

测试不趁早,“持续测试”搞不好

飞算JavaAI开发助手

DevOps 敏捷开发 自动化测试

KubeMeet 深圳站回顾:应对云原生边缘计算落地挑战

阿里巴巴云原生

阿里云 Kubernetes 云原生 线下活动

1 分钟 Serverless 极速抽盲盒,自己部署自己抽!

阿里巴巴云原生

阿里云 Serverless 云原生

react源码解析3.react源码架构

buchila11

源码 React React Hooks react源码

dart系列之:时间你慢点走,我要在dart中抓住你

程序那些事

flutter 架构 dart 程序那些事 11月日更

服务API版本控制设计与实践

vivo互联网技术

API 服务器端开发 客户端开发 迭代

架构实战营模块五作业

孙志强

架构实战营

内存数据库的分布式架构提升之道

鲸品堂

数据库

java开发之DOS命令学习及运行环境配置安装

@零度

java开发学习 DOS命令学习

并发编程中,你加的锁未必安全

华为云开发者联盟

线程 高并发 并发 线程安全

架构训练营 - 模块 5 作业

焦龙

架构训练营

如何在P4中管理Unreal Engine 代码

龙智—DevSecOps解决方案

版本控制 游戏开发 版本管理 游戏引擎 虚幻引擎

大厂算法面试之leetcode精讲9.位运算

全栈潇晨

算法 LeetCode

PackML从会到不会——状态机(1)

陈的错题集

标准化 PackML

移动计算云分布式数据缓存服务,实现快速可靠的跨区域多活复制

华为云开发者联盟

可用性 云数据缓存 跨区域多活 无冲突复制数据类型CRDT

百度商业大规模高性能全息日志检索技术揭秘

百度Geek说

软件架构

模型测试不再跳来跳去,VS Code + Hugging Face = 真香_AI&大模型_InfoQ精选文章