Thinking Machines发布Tinker API，实现灵活的模型微调_AI&大模型_InfoQ精选文章

2天时间，聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情 



 写点什么

登录/注册



大小：406.10K时长：02:18

Thinking Machines发布Tinker API，实现灵活的模型微调

Thinking Machines 公司发布了Tinker，这是一个用于开放权重语言模型微调的 API。这项服务旨在帮助开发者减少基础设施开销，并提供托管的调度、GPU 分配和检查点处理等功能。通过抽象化集群管理，Tinker 使开发者可以通过简单的 Python 调用进行微调。

Tinker 支持多种模型架构，从小型模型到大型混合专家系统，如Qwen-235B-A22B。开发者可以通过更改 Python 代码中的一个字符串来微调模型。该 API 提供了像 forward_backward 和 sample 这样的原语，可以作为灵活的构建块用于后训练方法。该平台集成了LoRA，可以提高并行运行微调时 GPU 内存的利用率，对于研究小组和资源有限的团队来说，这很实用。

该公司还发布了Tinker Cookbook，这是一个使用该 API 实现常见微调技术的开源存储库。其中包括强化学习方法和偏好优化工作流。来自普林斯顿、斯坦福、伯克利和 Redwood Research 的早期用户已经将 Tinker 应用于定理证明、化学推理及多智能体强化学习等任务。

Tinker 进入的这个领域之前就已经有其他的微调解决方案，如Hugging Face的Trainer API、OpenAI的微调端点和MosaicML的Composer。这些框架提供了更高层次的抽象或专注于特定的训练流程，而 Tinker 则侧重于暴露可以组合成新方法的低级原语，赋予开发者更多控制权，但不需要他们管理基础设施。

来自社区的最初反馈强调了灵活性和简单性之间的平衡。AI 专业人士Ignacio de Gregorio评论道：

这太棒了。RLaaS 正是企业所缺失的解决方案，它在实现目标的同时，还外包了最不利于企业发展的环节（分布式训练）。

Thinking Machines公司创始人Mira Murati指出：

Tinker 为研究人员带来了前沿工具，提供了清晰的抽象用于编写实验和训练流程，同时处理了分布式训练的复杂性。它支持创新研究、模型定制，并提供了可靠的基线。

目前，Tinker 尚处于封闭测试阶段。早期访问免费，后续将采用按使用量计费的模式。开发者和研究团队可直接向 Thinking Machines 申请访问权限。

声明：本文为 InfoQ 翻译，未经许可禁止转载。

原文链接：https://www.infoq.com/news/2025/10/thinking-machines-tinker/

评论

发布

暂无评论

PostgreSQL：您可能需要增加MAX_LOCKS_PER_TRANSACTION

PostgreSQLChina

数据库 postgresql 开源

“区块链+社会治理”模式获居民点赞

区块链区块链投票

神比喻：低代码开发像自动驾驶汽车，零代码开发像无人驾驶汽车！

J2PaaS低代码平台

程序员软件开发者低代码开发工具

Reactive Spring实战 -- 理解Reactor的设计与实现

reactor Reactive SpringBoot 2

阿里架构师478页Java工程师面试知识解析笔记pdf,一份2021年通往阿里的面试指南

Java架构之路

Java 程序员架构面试编程语言

云服务的可服务性经典6问

华为云开发者联盟

云服务计算

比特币10年：从2个披萨涨到2万美金，背后的三个“神秘人”

编程之美！从线程池状态管理来看二进制操作之美

Java 源码分析线程池

App性能测试揭秘（Android篇）

移动研发平台EMAS

阿里云软件测试测试性能测试云性能测试

学透这份300页的2020最新java面试题及答案，一线大厂offer随便拿

Java架构之路

Java 程序员架构面试编程语言

大众汽车“芯片荒”，折射汽车芯片的漫漫“自主替代”路

TypeScript | 第二章：类、接口和之间的关系

typescript 大前端七日更

大连市税务局局长赵福增：用区块链打破部门间“信息孤岛”

区块链汽车

大作业1

架构师一期

测开之函数进阶· 第2篇《纯函数》

清菡软件测试

2020，谁是中国ToB行业最有影响力的企业？

ToB行业头条

MSHA x Chaos 容灾高可用实践

阿里巴巴云原生

数据库高可用云原生中间件容灾

阿里开发10年，全部心血汇聚成到这份文档里，拿到30W的offer没问题

Java架构之路

Java 程序员架构面试编程语言

架构师训练营W10作业

脑洞：如何用一个整数来表示一个列表？

软件测试（功能、接口、性能、自动化）详解

测试人生路

倍频程与钢琴调式的距离

阿里云CloudImagine

音频技术音频

GitHub上3天1W赞的程序员学习路线！入门进阶都非常实用

Java架构之路

Java 程序员架构面试编程语言

英特尔宋继强：迈向可持续的千倍速计算未来

距离 Java 开发者玩转 Serverless，到底还有多远？

阿里巴巴云原生

Java Serverless 微服务云原生中间件

【Java入门】流

OPPO小布助手正在改变普罗米修斯的世界

LeetCode题解：55. 跳跃游戏，贪心，JavaScript，详细注释

算法大前端 LeetCode

量化交易系统开发搭建案例

薇電13242772558

区块链策略模式

由于不知线程池的bug,某Java程序员叕被祭天

Java架构师迁哥

volatile,synchronized可见性，有序性，原子性代码证明（基础硬核）

volatile 多线程 synchronized 原子性指令