2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Olmo 3 发布:模型开发与训练全程透明开放

作者:Robert Krzaczyński

  • 2025-11-26
    北京
  • 本文字数:1151 字

    阅读完需:约 4 分钟

大小:584.76K时长:03:19
Olmo 3 发布:模型开发与训练全程透明开放

艾伦人工智能研究所(Allen Institute for Artificial Intelligence)发布开源语言模型系列 Olmo 3,向研究人员与开发者完整开放模型全生命周期。与之前仅提供最终权重不同,Olmo 3 包含开发各个阶段的检查点、训练数据集和工具,覆盖用于推理、指令遵循和强化学习的预训练和后训练的完整链路。


Ai2 在公告中表示:

语言模型常被视为复杂开发过程的快照,仅分享最终结果等于抹去了后续进行修改与提升所依赖的关键信息,


Olmo 3 通过提供对整个模型生命周期的可见性来解决这一问题,使用户能够检查推理轨迹、修改数据集,并试验后训练技术,如监督微调(SFT)和可验证奖励强化学习(RLVR)。


此次发布的核心是 Olmo 3-Think(32B),一个专注于推理的模型,允许开发者检查中间推理步骤,并且输出能一路溯源到训练样本。对于较小规模的部署,Olmo 3-Base、3-Think 和 3-Instruct 的 7B 变体在编码、数学和多轮指令任务上表现出色,且可在普通硬件上运行。后训练路径支持不同用例:Instruct 专为聊天和工具使用设计,Think 用于多步推理,RL Zero 则聚焦于强化学习研究。


Olmo 3 系列在多个基准测试中表现强劲。在数学和推理测试中,Olmo 3-Think(32B)可与 Qwen 3 和 Gemma 3 等其他开放权重模型媲美,甚至超越它们,而 Olmo 3-Instruct(7B)在指令遵循、函数调用和聊天方面表现优异。Ai2 强调,这些模型在扩展上下文长度的情况下仍能保持较高的质量,可支持需要处理数万 token 的推理应用。


一位评测者评论道

我希望这个子版块能更多地为 Olmo 欢呼。这是一个真正自由且开放的模型,提供了所有数据,任何拥有算力资源的人都可以从零开始构建它。我们理应为他们加油,让他们知道他们的努力受到了赞赏,并能够继续下去。


Ai2 还强调了训练和工具的透明度。此次发布包括 Dolma 3,一个包含 9.3 万亿 token 的语料库,以及 Dolci,一个用于推理、工具使用和指令遵循任务的后训练数据集套件。OlmoTrace 等工具让用户可以看到输出如何与特定训练数据关联,弥合了模型行为与其来源之间的差距。


另一位 Reddit 用户指出 进展之快:

他们在如此短的时间内取得了巨大进展,基本上已经赶上了开放权重实验室。这些人正在“烹饪”,真正的开源已经超出“尽力而为”的范畴。


此次发布旨在促进实验室和社区的参与。研究人员可以在任意检查点分叉模型,整合领域特定数据,或测试新的强化学习目标。所有模型、数据集和训练产出均采用了宽松的许可,支持研究、教育及应用 AI 项目的开放开发。


Olmo 3 向“开放优先的 AI”迈出了关键一步,其中透明度、可追溯性和社区共建处于核心位置。用户可在 Ai2 Playground 中探索模型,通过 OpenRouter 获取权重,或下载所有检查点和数据集来构建自己的系统。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


查看英文原文https://www.infoq.com/news/2025/11/olmo3/

2025-11-26 16:023

评论

发布
暂无评论

堡垒机属于什么设备?是网络设备吗?

行云管家

网络安全 服务器 堡垒机 网络设备

首届 FinClip Hackathon 圆满落幕,亚马逊云科技|云服务平台助力获奖团队高速成长

FinClip

亚马逊 finclip FinClip Hackthon

设计模式关系图(全网首发)之行为模式

设计模式

云数赋能+数字办公 助力政企数字化

设计模式关系图(全网首发)之结构和创建模式

设计模式

“晕乎乎的概念”:阿里云函数计算的“应用”又是个啥

阿里巴巴云原生

阿里云 Serverless 云原生 函数计算

用更云原生的方式做诊断|大规模 K8s 集群诊断利器深度解析

尔达Erda

程序员 运维 云原生 k8s 工具

fastposter v2.8.1 发布 电商海报生成器

物有本末

Python Pillow fastposter fast-poster

Hoo网格策略 | 一「网」在手 告别「追涨杀跌」

区块链前沿News

虎符 Hoo 网格交易

AIRIOT物联网低代码平台如何配置欧姆龙omron驱动?

AIRIOT

低代码 物联网 驱动配置

【LeetCode】爬楼梯的最少成本Java题解

Albert

算法 LeetCode 5月月更

云计算和运维工程师冲突吗?运维岗需要云计算知识吗?

行云管家

云计算 运维 IT运维 云运维

时间堆原理详解及C++11的实现

C++后台开发

后端开发 Linux服务器开发 C++11 C++后台开发 时间堆

《方博碳讨室》:四问欧洲绿色能源转型

极客天地

墨天轮访谈 | 京东云曲艺伟:京东零售核心业务背后的数据库实践

墨天轮

数据库 京东云 国产数据库

【达人专栏】还不会用Apache Dolphinscheduler吗,大佬用时一个月写出的最全入门教学【二】

白鲸开源

Apache 大数据 开源 workflow dophinscheduler

Liga 讨论: ToB产品可不可以免费?

LigaAI

SaaS

【FinClip 黑客马拉松优秀参赛项目@灰鲸疫情地图】疫情之下,安全出行的一站式解决方案

FinClip

finclip FinClip Hackthon 疫情地图

当我们谈论服务质量的时候,我们在谈什么?

VoltDB

5G QoS 电信运营商

DeFi挖矿智能合约Dapp系统开发搭建

薇電13242772558

智能合约

LinkedList 源码分析-新增

zarmnosaj

5月月更

性能提升 57% ,SMC-R 透明加速 TCP 实战解析 | 龙蜥技术

OpenAnolis小助手

互联网 网络协议 高性能 TCP/IP 龙蜥技术

对话上市公司数字化转型:激活数据要素 倍增数字价值

BeeWorks

改善CRM系统策略的方法

低代码小观

CRM 客户关系管理 企业管理系统 CRM系统 客户关系管理系统

Squids DBMotion数据库迁移服务上线|助力云端数据畅游无阻!

沃趣科技

直播回顾 | 后疫情时代,食品行业破局秘籍get一下!

旺链科技

区块链 溯源 产业区块链

Wallys/ AR9531/WiFi Card/ MMCX

wallys-wifi6

AR9531 30dBm high power

深入微服务-服务注册与发现 SpringCloud Eureka之基础

janyxe

微服务 云原生 SpringCloud Eureka 服务注册与发现

【直播回顾】如何成为一名优秀的OpenHamrony贡献者?

OpenHarmony开发者

OpenHarmony 贡献代码

Olmo 3 发布:模型开发与训练全程透明开放_AI&大模型_InfoQ精选文章