AICon 深圳站 Keynote 嘉宾官宣!共探AI价值转化的实践路径 了解详情
写点什么

OpenAI 开放 gpt-oss-120b 和 gpt-oss-20b 模型权重,可在本地部署

作者:Robert Krzaczyński

  • 2025-08-11
    北京
  • 本文字数:1092 字

    阅读完需:约 4 分钟

大小:558.40K时长:03:10
OpenAI开放gpt-oss-120b和gpt-oss-20b模型权重,可在本地部署

OpenAI 发布 gpt-oss-120b 和 gpt-oss-20b 两款开源权重语言模型,专为高性能推理、工具使用和高效部署而设计。这是自 GPT-2 以来 OpenAI 首次完全开放模型权重,基于宽松的 Apache 2.0 开源许可。


gpt-oss-120b 模型采用了专家混合架构,每个词元可激活 51 亿个参数。在核心推理基准测试中,它不仅与专有的 o4-mini 模型表现相当,甚至在某些方面实现了超越,同时能够在单个 80 GB GPU 上高效运行。较小的 gpt-oss-20b 模型可以激活 210 亿参数中的 36 亿个参数,能够在仅配备 16 GB 内存的消费级硬件上运行,适合在设备端进行推理或是用于无需依赖云基础设施的快速迭代场景。


这两款模型支持多种高级应用场景,包括思维链推理、工具使用和结构化输出。开发人员可以根据具体需求灵活配置模型,调整其推理力度,从而在速度和准确性之间取得平衡。


gpt-oss 模型基于 OpenAI 内部 o 系列模型改编的技术进行训练,采用了旋转位置嵌入、分组多查询注意力机制,并支持长达 128k 的上下文长度。它们在编程、健康、数学和智能体基准测试(包括 MMLU、HealthBench、Codeforces 和 TauBench)中表现出色,即使与 o4-mini 和 GPT-4o 等闭源模型相比也毫不逊色。



来源:OpenAI 博客


在发布这些模型时,OpenAI 并未对其思维链(CoT)推理进行直接监督,从而为研究人员提供了研究推理轨迹的机会,以便他们能够深入探究潜在问题,例如偏见或滥用等情况。


为了评估风险,OpenAI 采用生物学和网络安全领域的对抗性数据,对这些模型进行了最坏情况下的微调。即便经过如此高强度的微调,根据 OpenAI 的防范准备框架,这些模型仍未达到高风险能力水平。外部专家评审员的发现为模型的最终发布提供了有力依据。此外,公司还启动了一项奖金池高达 50 万美元的红队测试挑战赛,旨在进一步在现实条件下对这些模型进行全面评估。


这些模型可在 Hugging Face 和多个部署平台上使用。20B 模型可以在仅配备 16 GB 内存的本地计算机上运行。一位 Reddit 用户提出了这样的问题

这个模型是否可以在不联网的情况下在本地计算机上运行呢?Altman 提到的“高端”最低配置计算机是什么样的配置?


另一位用户澄清道:

下载完成后,无需联网即可运行模型。硬件配置:运行 20B 模型至少需要 16 GB 的内存(显存或系统内存)。配备 16 GB 内存的 MacBook Air 每秒可以处理数十个词元,而现代 GPU 每秒可以处理数百个词元。


微软通过 ONNX Runtime 将 20B 模型的 GPU 优化版本引入 Windows,并通过 Foundry Local 和 VS Code 的 AI 工具包提供支持,进一步降低了开发者使用该模型的门槛。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


原文链接:

https://www.infoq.com/news/2025/08/openai-gpt-oss/

2025-08-11 14:553

评论

发布
暂无评论

Vue组件-非单文本组件

我搬去水星了

6 月 优质更文活动

vuex中的四个map方法的使用

张三丰无极

6 月 优质更文活动

vue动画效果的使用

张三丰无极

6 月 优质更文活动

Vue-组件自定义事件(绑定和解绑)

我搬去水星了

6 月 优质更文活动

Vue-全局事件总线(GlobalEventBus)

我搬去水星了

6 月 优质更文活动

Vue-插件(plugin)

我搬去水星了

6 月 优质更文活动

Vuex的基本使用

张三丰无极

6 月 优质更文活动

【6.02-6.09】写作社区优秀技术博文一览

InfoQ写作社区官方

热门活动 优质创作周报

Vue-路由(route)的简介

张三丰无极

6 月 优质更文活动

Meetup 报名|06.17 StarRocks & Friends 与你相约上海

StarRocks

数据库 大数据 OLAP Meetup 线下活动

Vue-scoped(局部)样式

我搬去水星了

6 月 优质更文活动

禅道软件14年原创研发荣膺SAFe平台合作伙伴,国际权威机构认可专业实力

禅道项目管理

敏捷开发 safe 禅道 禅道项目管理

Vue-组件的嵌套

我搬去水星了

6 月 优质更文活动

Vue- ref属性

我搬去水星了

6 月 优质更文活动

Vue基本的内置指令

我搬去水星了

6 月 优质更文活动

vue-表单元素进阶收集操作

我搬去水星了

6 月 优质更文活动

NFTScan 与 Realy 达成合作伙伴,双方在元宇宙 NFT 数据方面进行深度合作!

NFT Research

NFT Metaverse

Vue路由的基本应用

张三丰无极

6 月 优质更文活动

Vue-插槽(slot)的使用

张三丰无极

6 月 优质更文活动

Vue- mixin(混入)

我搬去水星了

6 月 优质更文活动

Vue-props配置

我搬去水星了

6 月 优质更文活动

Vue自定义指令

我搬去水星了

6 月 优质更文活动

创建Vue脚手架(Vue CLI)并分析项目结构

我搬去水星了

6 月 优质更文活动

Vue单文件组件

我搬去水星了

6 月 优质更文活动

vuex-getters配置项

张三丰无极

6 月 优质更文活动

充分结合AI后的数智平台能做什么?

用友BIP

数智平台

Vue-消息订阅与发布(pub/sub)

我搬去水星了

6 月 优质更文活动

揭秘:云南白药如何激活组织活力!

用友BIP

人力资源 数智人力

浏览器存储(webStorage)

我搬去水星了

6 月 优质更文活动

Vue-搭建Vuex开发环境

张三丰无极

6 月 优质更文活动

Vue中组件的几个重要点

我搬去水星了

6 月 优质更文活动

OpenAI开放gpt-oss-120b和gpt-oss-20b模型权重,可在本地部署_AI&大模型_InfoQ精选文章