5 月 15 日,蚂蚁百灵宣布其旗舰级思考模型 Ring-2.6-1T 正式开源,权重文件同步上线 Hugging Face、ModelScope 平台。此前,该模型上线 OpenRouter,并开放限时免费 API 体验。
Ring-2.6-1T 是一款拥有万亿个参数的旗舰级推理模型,专为现实世界的复杂任务场景而设计,可供开发人员、研究人员和企业环境进行验证、调整和进一步开发。其核心设计逻辑是“按需思考”,模型引入了可调节的 Reasoning Effort 机制,支持 high 与 xhigh 两种推理强度,开发者可以根据任务特性动态分配推理资源。
项目地址:https://huggingface.co/inclusionAI/Ring-2.6-1T
Ring-2.6-1T 的目标并非仅仅追求更大的参数规模,而是为了应对大型模型正在进入的实际生产环境:代理工作流、工程开发、科学研究分析、复杂的业务系统以及企业自动化流程。在这些场景中,模型不仅需要“回答问题”,还需要理解上下文、规划步骤、调用工具、持续执行,并在长期任务中保持稳定性。
Ring-2.6-1T 在三个方面实现了关键升级:
全面增强代理执行能力:从“能够回答”到“能够执行”,在多步骤任务、工具协作、上下文规划和推进复杂工作流程方面表现更稳定。
Reasoning Effort 机制:支持两种推理强度级别,high 和 xhigh,允许开发人员根据任务复杂性灵活调整思考深度,从而在效率、速度和成本之间取得更好的平衡。
异步强化学习训练范式:在训练层面,Ring-2.6-1T 采用异步(Async)强化学习训练架构,将策略采样与参数更新解耦为独立流水线,解决了传统同步训练中 GPU 资源等待、训练吞吐不足的问题,并支持更长周期的持续训练。在此基础上,百灵将此前在 Ring-1T 中验证过的“棒冰算法”引入异步 RL 训练,解决训练不稳定问题。
百灵表示,相关技术细节将在后续技术报告中公开。

根据权威评测,Ring-2.6-1T 的两档模式各有所长。high 模式下,PinchBench 得分 87.60,高于 GPT-5.4 xHigh 和 Gemini-3.1-Pro high,Tau2-Bench Telecom 达到 95.32,Agent 场景执行能力显著。xhigh 模式下,AIME 26 得分 95.83,接近多家头部模型水平;GPQA Diamond 达到 88.27,体现出稳健的科学知识理解与复杂推理能力。





