10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

OpenAI 开放 gpt-oss-120b 和 gpt-oss-20b 模型权重,可在本地部署

作者:Robert Krzaczyński

  • 2025-08-11
    北京
  • 本文字数:1092 字

    阅读完需:约 4 分钟

大小:558.40K时长:03:10
OpenAI开放gpt-oss-120b和gpt-oss-20b模型权重,可在本地部署

OpenAI 发布 gpt-oss-120b 和 gpt-oss-20b 两款开源权重语言模型,专为高性能推理、工具使用和高效部署而设计。这是自 GPT-2 以来 OpenAI 首次完全开放模型权重,基于宽松的 Apache 2.0 开源许可。


gpt-oss-120b 模型采用了专家混合架构,每个词元可激活 51 亿个参数。在核心推理基准测试中,它不仅与专有的 o4-mini 模型表现相当,甚至在某些方面实现了超越,同时能够在单个 80 GB GPU 上高效运行。较小的 gpt-oss-20b 模型可以激活 210 亿参数中的 36 亿个参数,能够在仅配备 16 GB 内存的消费级硬件上运行,适合在设备端进行推理或是用于无需依赖云基础设施的快速迭代场景。


这两款模型支持多种高级应用场景,包括思维链推理、工具使用和结构化输出。开发人员可以根据具体需求灵活配置模型,调整其推理力度,从而在速度和准确性之间取得平衡。


gpt-oss 模型基于 OpenAI 内部 o 系列模型改编的技术进行训练,采用了旋转位置嵌入、分组多查询注意力机制,并支持长达 128k 的上下文长度。它们在编程、健康、数学和智能体基准测试(包括 MMLU、HealthBench、Codeforces 和 TauBench)中表现出色,即使与 o4-mini 和 GPT-4o 等闭源模型相比也毫不逊色。



来源:OpenAI 博客


在发布这些模型时,OpenAI 并未对其思维链(CoT)推理进行直接监督,从而为研究人员提供了研究推理轨迹的机会,以便他们能够深入探究潜在问题,例如偏见或滥用等情况。


为了评估风险,OpenAI 采用生物学和网络安全领域的对抗性数据,对这些模型进行了最坏情况下的微调。即便经过如此高强度的微调,根据 OpenAI 的防范准备框架,这些模型仍未达到高风险能力水平。外部专家评审员的发现为模型的最终发布提供了有力依据。此外,公司还启动了一项奖金池高达 50 万美元的红队测试挑战赛,旨在进一步在现实条件下对这些模型进行全面评估。


这些模型可在 Hugging Face 和多个部署平台上使用。20B 模型可以在仅配备 16 GB 内存的本地计算机上运行。一位 Reddit 用户提出了这样的问题

这个模型是否可以在不联网的情况下在本地计算机上运行呢?Altman 提到的“高端”最低配置计算机是什么样的配置?


另一位用户澄清道:

下载完成后,无需联网即可运行模型。硬件配置:运行 20B 模型至少需要 16 GB 的内存(显存或系统内存)。配备 16 GB 内存的 MacBook Air 每秒可以处理数十个词元,而现代 GPU 每秒可以处理数百个词元。


微软通过 ONNX Runtime 将 20B 模型的 GPU 优化版本引入 Windows,并通过 Foundry Local 和 VS Code 的 AI 工具包提供支持,进一步降低了开发者使用该模型的门槛。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


原文链接:

https://www.infoq.com/news/2025/08/openai-gpt-oss/

2025-08-11 14:553895

评论

发布
暂无评论

黑龙江三级等保测评:高安全级别的全面解析

等保测评

CST基础教程:如何理解TDR上升沿等于0.876除以Fmax

思茂信息

cst 电磁仿真 CST Studio Suite

YashanDB数据库:为现代化企业架构提供服务的核心

数据库砖家

YashanDB数据库:支持企业数字化转型的关键工具

数据库砖家

自控学习历程系列 项目管理经验总结(5)

万里无云万里天

工厂运维

e签宝APP登顶鸿蒙生态Top50:重塑全场景电子签名安全标杆

科技汇

黑龙江等保测评:筑牢网络安全防线的基石

等保测评

Jaeger,一个链路追踪神器!

左诗右码

播放器视频后处理实践(一)

百度Geek说

极速模糊测试工具Shin GRR:重新定义二进制程序漏洞挖掘

qife122

漏洞挖掘 模糊测试

最近悄悄流行的一类新工种:ITBP

安全乐谷

求职 找工作 招聘 找实习 工作岗位

YashanDB数据库:完整指南与使用技巧

数据库砖家

BeeWorks的即时通讯工具有何独特优势?

BeeWorks

即时通讯 IM 私有化部署

解析 vLLM 架构及源码系列:V1 调度器分析

Jason黄

vLLM源码

自控学习历程系列 综合安防维护经验总结(4)

万里无云万里天

工厂运维

TypeScript Record类型完全指南:从基础到高级应用

qife122

typescript 类型系统

IM 即时通讯:BeeWorks 助力企业打造安全高效的内部沟通体系

BeeWorks

即时通讯 IM 私有化部署

Android开发者的瑞士军刀:高效工具库AndroidUtilCode

qife122

android 开发效率

RAG 文档解析工具选型指南

Baihai IDP

开源 程序员 AI rag 文档解析

基于YOLOv8的铁路工人安全作业检测系统|精准识别反光背心与安全帽

申公豹

人工智能

DeepSeekV3.1+ClaudeCode丨小白5分钟写出高颜值封面生成器

阿星AI工作室

产品 编程 AI 大模型 DeepSeek

AI评测(AI Evaluations):比模型更大的护城河

非晓为骁

AI Evalution Evals AI 评测

YashanDB数据库安全策略与运维管理指南

数据库砖家

别再光投广告了,天润融通Agent客服也是增长新入口

天润融通

企业迎来AI员工时代,谁决定了它的真实战斗力?

天润融通

从全栈到 AI PM:自我否定到重塑

非晓为骁

转型 全栈 AI产品经理 AI PM

YashanDB数据库API设计与性能优化技巧

数据库砖家

java中post请求调用下载文件接口浏览器未弹窗而是返回一堆json,为啥

刘大猫

深度学习 算法 数据分析 大模型 人工智能、

StarRocks Community Monthly Newsletter (Jul)

StarRocks

数据库 StarRocks

哈尔滨等保测评:守护智慧城市的安全脉搏

等保测评

YashanDB数据库SQL调优经验分享

数据库砖家

OpenAI开放gpt-oss-120b和gpt-oss-20b模型权重,可在本地部署_AI&大模型_InfoQ精选文章