Olmo 3 发布：模型开发与训练全程透明开放_AI&大模型_InfoQ精选文章

2天时间，聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情 



 写点什么

登录/注册



大小：584.76K时长：03:19

Olmo 3 发布：模型开发与训练全程透明开放

艾伦人工智能研究所（Allen Institute for Artificial Intelligence）发布开源语言模型系列 Olmo 3，向研究人员与开发者完整开放模型全生命周期。与之前仅提供最终权重不同，Olmo 3 包含开发各个阶段的检查点、训练数据集和工具，覆盖用于推理、指令遵循和强化学习的预训练和后训练的完整链路。

Ai2 在公告中表示：

语言模型常被视为复杂开发过程的快照，仅分享最终结果等于抹去了后续进行修改与提升所依赖的关键信息，

Olmo 3 通过提供对整个模型生命周期的可见性来解决这一问题，使用户能够检查推理轨迹、修改数据集，并试验后训练技术，如监督微调（SFT）和可验证奖励强化学习（RLVR）。

此次发布的核心是 Olmo 3-Think（32B），一个专注于推理的模型，允许开发者检查中间推理步骤，并且输出能一路溯源到训练样本。对于较小规模的部署，Olmo 3-Base、3-Think 和 3-Instruct 的 7B 变体在编码、数学和多轮指令任务上表现出色，且可在普通硬件上运行。后训练路径支持不同用例：Instruct 专为聊天和工具使用设计，Think 用于多步推理，RL Zero 则聚焦于强化学习研究。

Olmo 3 系列在多个基准测试中表现强劲。在数学和推理测试中，Olmo 3-Think（32B）可与 Qwen 3 和 Gemma 3 等其他开放权重模型媲美，甚至超越它们，而 Olmo 3-Instruct（7B）在指令遵循、函数调用和聊天方面表现优异。Ai2 强调，这些模型在扩展上下文长度的情况下仍能保持较高的质量，可支持需要处理数万 token 的推理应用。

一位评测者评论道：

我希望这个子版块能更多地为 Olmo 欢呼。这是一个真正自由且开放的模型，提供了所有数据，任何拥有算力资源的人都可以从零开始构建它。我们理应为他们加油，让他们知道他们的努力受到了赞赏，并能够继续下去。

Ai2 还强调了训练和工具的透明度。此次发布包括 Dolma 3，一个包含 9.3 万亿 token 的语料库，以及 Dolci，一个用于推理、工具使用和指令遵循任务的后训练数据集套件。OlmoTrace 等工具让用户可以看到输出如何与特定训练数据关联，弥合了模型行为与其来源之间的差距。

另一位 Reddit 用户指出进展之快：

他们在如此短的时间内取得了巨大进展，基本上已经赶上了开放权重实验室。这些人正在“烹饪”，真正的开源已经超出“尽力而为”的范畴。

此次发布旨在促进实验室和社区的参与。研究人员可以在任意检查点分叉模型，整合领域特定数据，或测试新的强化学习目标。所有模型、数据集和训练产出均采用了宽松的许可，支持研究、教育及应用 AI 项目的开放开发。

Olmo 3 向“开放优先的 AI”迈出了关键一步，其中透明度、可追溯性和社区共建处于核心位置。用户可在 Ai2 Playground 中探索模型，通过 OpenRouter 获取权重，或下载所有检查点和数据集来构建自己的系统。

【声明：本文由 InfoQ 翻译，未经许可禁止转载。】

查看英文原文：https://www.infoq.com/news/2025/11/olmo3/

评论

发布

暂无评论

堡垒机属于什么设备？是网络设备吗？

网络安全服务器堡垒机网络设备

首届 FinClip Hackathon 圆满落幕，亚马逊云科技｜云服务平台助力获奖团队高速成长

亚马逊 finclip FinClip Hackthon

设计模式关系图（全网首发）之行为模式

云数赋能+数字办公助力政企数字化

设计模式关系图（全网首发）之结构和创建模式

“晕乎乎的概念”：阿里云函数计算的“应用”又是个啥

阿里巴巴云原生

阿里云 Serverless 云原生函数计算

用更云原生的方式做诊断｜大规模 K8s 集群诊断利器深度解析

程序员运维云原生 k8s 工具

fastposter v2.8.1 发布电商海报生成器

Python Pillow fastposter fast-poster

Hoo网格策略｜一「网」在手告别「追涨杀跌」

区块链前沿News

虎符 Hoo 网格交易

AIRIOT物联网低代码平台如何配置欧姆龙omron驱动？

低代码物联网驱动配置

【LeetCode】爬楼梯的最少成本Java题解

算法 LeetCode 5月月更

云计算和运维工程师冲突吗？运维岗需要云计算知识吗？

云计算运维 IT运维云运维

时间堆原理详解及C++11的实现

C++后台开发

后端开发 Linux服务器开发 C++11 C++后台开发时间堆

《方博碳讨室》：四问欧洲绿色能源转型

墨天轮访谈 | 京东云曲艺伟：京东零售核心业务背后的数据库实践

数据库京东云国产数据库

【达人专栏】还不会用Apache Dolphinscheduler吗，大佬用时一个月写出的最全入门教学【二】

Apache 大数据开源 workflow dophinscheduler

Liga 讨论： ToB产品可不可以免费？

【FinClip 黑客马拉松优秀参赛项目@灰鲸疫情地图】疫情之下，安全出行的一站式解决方案

finclip FinClip Hackthon 疫情地图

当我们谈论服务质量的时候，我们在谈什么？

5G QoS 电信运营商

DeFi挖矿智能合约Dapp系统开发搭建

薇電13242772558

LinkedList 源码分析-新增

性能提升 57% ，SMC-R 透明加速 TCP 实战解析 | 龙蜥技术

OpenAnolis小助手

互联网网络协议高性能 TCP/IP 龙蜥技术

对话上市公司数字化转型：激活数据要素倍增数字价值

改善CRM系统策略的方法

低代码小观

CRM 客户关系管理企业管理系统 CRM系统客户关系管理系统

Squids DBMotion数据库迁移服务上线｜助力云端数据畅游无阻！

直播回顾 | 后疫情时代，食品行业破局秘籍get一下！

区块链溯源产业区块链

Wallys/ AR9531/WiFi Card/ MMCX

AR9531 30dBm high power

深入微服务-服务注册与发现 SpringCloud Eureka之基础

微服务云原生 SpringCloud Eureka 服务注册与发现

【直播回顾】如何成为一名优秀的OpenHamrony贡献者？

OpenHarmony开发者

OpenHarmony 贡献代码