兼顾效率、成本与能力，百灵开源旗舰推理模型 Ring-2.6-1T

5 月 15 日，蚂蚁百灵宣布其旗舰级思考模型 Ring-2.6-1T 正式开源，权重文件同步上线 Hugging Face、ModelScope 平台。此前，该模型上线 OpenRouter，并开放限时免费 API 体验。

Ring-2.6-1T 是一款拥有万亿个参数的旗舰级推理模型，专为现实世界的复杂任务场景而设计，可供开发人员、研究人员和企业环境进行验证、调整和进一步开发。其核心设计逻辑是“按需思考”，模型引入了可调节的 Reasoning Effort 机制，支持 high 与 xhigh 两种推理强度，开发者可以根据任务特性动态分配推理资源。

项目地址：https://huggingface.co/inclusionAI/Ring-2.6-1T

Ring-2.6-1T 的目标并非仅仅追求更大的参数规模，而是为了应对大型模型正在进入的实际生产环境：代理工作流、工程开发、科学研究分析、复杂的业务系统以及企业自动化流程。在这些场景中，模型不仅需要“回答问题”，还需要理解上下文、规划步骤、调用工具、持续执行，并在长期任务中保持稳定性。

Ring-2.6-1T 在三个方面实现了关键升级：

全面增强代理执行能力：从“能够回答”到“能够执行”，在多步骤任务、工具协作、上下文规划和推进复杂工作流程方面表现更稳定。
Reasoning Effort 机制：支持两种推理强度级别，high 和 xhigh，允许开发人员根据任务复杂性灵活调整思考深度，从而在效率、速度和成本之间取得更好的平衡。
异步强化学习训练范式：在训练层面，Ring-2.6-1T 采用异步（Async）强化学习训练架构，将策略采样与参数更新解耦为独立流水线，解决了传统同步训练中 GPU 资源等待、训练吞吐不足的问题，并支持更长周期的持续训练。在此基础上，百灵将此前在 Ring-1T 中验证过的“棒冰算法”引入异步 RL 训练，解决训练不稳定问题。

百灵表示，相关技术细节将在后续技术报告中公开。

根据权威评测，Ring-2.6-1T 的两档模式各有所长。high 模式下，PinchBench 得分 87.60，高于 GPT-5.4 xHigh 和 Gemini-3.1-Pro high，Tau2-Bench Telecom 达到 95.32，Agent 场景执行能力显著。xhigh 模式下，AIME 26 得分 95.83，接近多家头部模型水平；GPQA Diamond 达到 88.27，体现出稳健的科学知识理解与复杂推理能力。

创作场景

兼顾效率、成本与能力，百灵开源旗舰推理模型 Ring-2.6-1T