2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

OpenAI 开放 gpt-oss-120b 和 gpt-oss-20b 模型权重,可在本地部署

作者:Robert Krzaczyński

  • 2025-08-11
    北京
  • 本文字数:1092 字

    阅读完需:约 4 分钟

大小:558.40K时长:03:10
OpenAI开放gpt-oss-120b和gpt-oss-20b模型权重,可在本地部署

OpenAI 发布 gpt-oss-120b 和 gpt-oss-20b 两款开源权重语言模型,专为高性能推理、工具使用和高效部署而设计。这是自 GPT-2 以来 OpenAI 首次完全开放模型权重,基于宽松的 Apache 2.0 开源许可。


gpt-oss-120b 模型采用了专家混合架构,每个词元可激活 51 亿个参数。在核心推理基准测试中,它不仅与专有的 o4-mini 模型表现相当,甚至在某些方面实现了超越,同时能够在单个 80 GB GPU 上高效运行。较小的 gpt-oss-20b 模型可以激活 210 亿参数中的 36 亿个参数,能够在仅配备 16 GB 内存的消费级硬件上运行,适合在设备端进行推理或是用于无需依赖云基础设施的快速迭代场景。


这两款模型支持多种高级应用场景,包括思维链推理、工具使用和结构化输出。开发人员可以根据具体需求灵活配置模型,调整其推理力度,从而在速度和准确性之间取得平衡。


gpt-oss 模型基于 OpenAI 内部 o 系列模型改编的技术进行训练,采用了旋转位置嵌入、分组多查询注意力机制,并支持长达 128k 的上下文长度。它们在编程、健康、数学和智能体基准测试(包括 MMLU、HealthBench、Codeforces 和 TauBench)中表现出色,即使与 o4-mini 和 GPT-4o 等闭源模型相比也毫不逊色。



来源:OpenAI 博客


在发布这些模型时,OpenAI 并未对其思维链(CoT)推理进行直接监督,从而为研究人员提供了研究推理轨迹的机会,以便他们能够深入探究潜在问题,例如偏见或滥用等情况。


为了评估风险,OpenAI 采用生物学和网络安全领域的对抗性数据,对这些模型进行了最坏情况下的微调。即便经过如此高强度的微调,根据 OpenAI 的防范准备框架,这些模型仍未达到高风险能力水平。外部专家评审员的发现为模型的最终发布提供了有力依据。此外,公司还启动了一项奖金池高达 50 万美元的红队测试挑战赛,旨在进一步在现实条件下对这些模型进行全面评估。


这些模型可在 Hugging Face 和多个部署平台上使用。20B 模型可以在仅配备 16 GB 内存的本地计算机上运行。一位 Reddit 用户提出了这样的问题

这个模型是否可以在不联网的情况下在本地计算机上运行呢?Altman 提到的“高端”最低配置计算机是什么样的配置?


另一位用户澄清道:

下载完成后,无需联网即可运行模型。硬件配置:运行 20B 模型至少需要 16 GB 的内存(显存或系统内存)。配备 16 GB 内存的 MacBook Air 每秒可以处理数十个词元,而现代 GPU 每秒可以处理数百个词元。


微软通过 ONNX Runtime 将 20B 模型的 GPU 优化版本引入 Windows,并通过 Foundry Local 和 VS Code 的 AI 工具包提供支持,进一步降低了开发者使用该模型的门槛。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


原文链接:

https://www.infoq.com/news/2025/08/openai-gpt-oss/

2025-08-11 14:554358

评论

发布
暂无评论

区块链钱包系统开发,imtoken去中心化钱搭建

灵活且有趣,10分钟落地翻译能力,1分钟插件化

明道云

解决“百万富翁问题”—隐私比较高效算法解读

趣链科技

隐私计算 安全多方计算

Nebula Operator 云上实践

NebulaGraph

阿里云 云原生 k8s 图数据库 分布式图数据库

crudapi增删改查接口零代码产品成功案例之金茶王投票系统

crudapi

Vue API crud crudapi 投票

阿里 Java 二面必问:8张图带你解决所有TCP可靠传输问题

编程 面试 TCP 网络 计算机

谷歌架构师分享gRPC与云原生应用开发Go和Java为例文档

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

linux 工具之pstack/gstack

webrtc developer

我爬取了爬虫岗位薪资,分析后发现爬虫真香

Python研究者

8月日更

模块五设计微博评论高性能高可用计算架构

kitten

校招失败,在小公司熬了2年后我终于进了字节跳动,竭尽全力(Java岗)

今晚早点睡

Java 编程 字节跳动 面试 计算机

linux 工具之perf

webrtc developer

前端基础三之JavaScript基础

ベ布小禅

8月日更

面面俱到!腾讯大牛把源码分析、基础案例、实战案例、面试、系统架构,全部总结到这份Java多线程与高并发里面了

Java 编程 程序员 面试 多线程

我们可能是被工具耽误的一代

非著名程序员

深度思考 认知提升 成长笔记 8月日更

架构实战营1期模块5作业——高性能计算架构

tt

架构实战营

Handler简单入门

W🌥

android 8月日更 Handler

抖音快手截流获客系统软件开发

薇電13242772558

获客达人

模块五作业

燕燕 yen yen

架构实战营

RunC TOCTOU逃逸CVE-2021-30465分析

腾讯安全云鼎实验室

容器 漏洞分析

不会被开除吧?一顿饭换来“字节”面试题库Java岗,刷完直接入职大厂

Java架构师迁哥

干货|后互联网时代,运维工程师的必备性能优化指北

阿里巴巴中间件

阿里云 云原生 中间件

leetcode 最常见的前端基础算法面试题(上)

前端依依

面试 大前端 力扣 算法题 初阶

「模块化安装」,定义你自己的CloudQuery

BinTools图尔兹

sql 数据安全 数据库管理 polarDB

0代码之缘

明道云

架构实战营模块 5 作业指导

华仔

#架构实战营

音视频demo| 不一样的AR Call

anyRTC开发者

uni-app 音视频 移动开发 uni-app demo

架构实战训练营模块五作业

Clarke

终于拿到了深入Java虚拟机:JVMG1GC的算法与实现文档

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

Vue进阶(四十二):var、let、const 三者区别

No Silver Bullet

Vue var const let 8月日更

ipfs矿机配置标准如何?ipfs矿机配置带宽要求是什么?

ipfs矿机配置标准如何 ipfs矿机配置带宽要求

OpenAI开放gpt-oss-120b和gpt-oss-20b模型权重,可在本地部署_AI&大模型_InfoQ精选文章