2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Thinking Machines 发布 Tinker API,实现灵活的模型微调

作者:Daniel Dominguez

  • 2025-10-11
    北京
  • 本文字数:845 字

    阅读完需:约 3 分钟

大小:406.10K时长:02:18
Thinking Machines发布Tinker API,实现灵活的模型微调

Thinking Machines 公司发布了Tinker,这是一个用于开放权重语言模型微调的 API。这项服务旨在帮助开发者减少基础设施开销,并提供托管的调度、GPU 分配和检查点处理等功能。通过抽象化集群管理,Tinker 使开发者可以通过简单的 Python 调用进行微调。

 

Tinker 支持多种模型架构,从小型模型到大型混合专家系统,如Qwen-235B-A22B。开发者可以通过更改 Python 代码中的一个字符串来微调模型。该 API 提供了像 forward_backward 和 sample 这样的原语,可以作为灵活的构建块用于后训练方法。该平台集成了LoRA,可以提高并行运行微调时 GPU 内存的利用率,对于研究小组和资源有限的团队来说,这很实用。

 

该公司还发布了Tinker Cookbook,这是一个使用该 API 实现常见微调技术的开源存储库。其中包括强化学习方法和偏好优化工作流。来自普林斯顿、斯坦福、伯克利和 Redwood Research 的早期用户已经将 Tinker 应用于定理证明、化学推理及多智能体强化学习等任务。

 

Tinker 进入的这个领域之前就已经有其他的微调解决方案,如Hugging Face的Trainer APIOpenAI的微调端点MosaicML的Composer。这些框架提供了更高层次的抽象或专注于特定的训练流程,而 Tinker 则侧重于暴露可以组合成新方法的低级原语,赋予开发者更多控制权,但不需要他们管理基础设施。

 

来自社区的最初反馈强调了灵活性和简单性之间的平衡。AI 专业人士Ignacio de Gregorio评论道:

 

这太棒了。RLaaS 正是企业所缺失的解决方案,它在实现目标的同时,还外包了最不利于企业发展的环节(分布式训练)。

 

Thinking Machines公司创始人Mira Murati指出:

 

Tinker 为研究人员带来了前沿工具,提供了清晰的抽象用于编写实验和训练流程,同时处理了分布式训练的复杂性。它支持创新研究、模型定制,并提供了可靠的基线。

 

目前,Tinker 尚处于封闭测试阶段。早期访问免费,后续将采用按使用量计费的模式。开发者和研究团队可直接向 Thinking Machines 申请访问权限。

 

声明:本文为 InfoQ 翻译,未经许可禁止转载。

 

原文链接:https://www.infoq.com/news/2025/10/thinking-machines-tinker/

2025-10-11 11:005491

评论

发布
暂无评论

PostgreSQL:您可能需要增加MAX_LOCKS_PER_TRANSACTION

PostgreSQLChina

数据库 postgresql 开源

“区块链+社会治理”模式获居民点赞

CECBC

区块链 区块链投票

神比喻:低代码开发像自动驾驶汽车,零代码开发像无人驾驶汽车!

J2PaaS低代码平台

程序员 软件 开发者 低代码 开发工具

Reactive Spring实战 -- 理解Reactor的设计与实现

binecy

reactor Reactive SpringBoot 2

阿里架构师478页Java工程师面试知识解析笔记pdf,一份2021年通往阿里的面试指南

Java架构之路

Java 程序员 架构 面试 编程语言

云服务的可服务性经典6问

华为云开发者联盟

服务 计算

比特币10年:从2个披萨涨到2万美金,背后的三个“神秘人”

CECBC

比特币

编程之美!从线程池状态管理来看二进制操作之美

Geek Tech

Java 源码分析 线程池

App性能测试揭秘(Android篇)

移动研发平台EMAS

阿里云 软件测试 测试 性能测试 云性能测试

学透这份300页的2020最新java面试题及答案,一线大厂offer随便拿

Java架构之路

Java 程序员 架构 面试 编程语言

大众汽车“芯片荒”,折射汽车芯片的漫漫“自主替代”路

脑极体

TypeScript | 第二章:类、接口和之间的关系

梁龙先森

typescript 大前端 七日更

大连市税务局局长赵福增:用区块链打破部门间“信息孤岛”

CECBC

区块链 汽车

大作业1

龙卷风

架构师一期

测开之函数进阶· 第2篇《纯函数》

清菡软件测试

测试开发

2020,谁是中国ToB行业最有影响力的企业?

ToB行业头条

MSHA x Chaos 容灾高可用实践

阿里巴巴云原生

数据库 高可用 云原生 中间件 容灾

阿里开发10年,全部心血汇聚成到这份文档里,拿到30W的offer没问题

Java架构之路

Java 程序员 架构 面试 编程语言

架构师训练营W10作业

Geek_f06ede

脑洞:如何用一个整数来表示一个列表?

Python猫

Python

软件测试(功能、接口、性能、自动化)详解

测试人生路

软件测试

倍频程与钢琴调式的距离

阿里云CloudImagine

音频技术 音频

GitHub上3天1W赞的程序员学习路线!入门进阶都非常实用

Java架构之路

Java 程序员 架构 面试 编程语言

英特尔宋继强:迈向可持续的千倍速计算未来

E科讯

距离 Java 开发者玩转 Serverless,到底还有多远?

阿里巴巴云原生

Java Serverless 微服务 云原生 中间件

【Java入门】流

Albert

Java 七日更

OPPO小布助手正在改变普罗米修斯的世界

脑极体

LeetCode题解:55. 跳跃游戏,贪心,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

量化交易系统开发搭建案例

薇電13242772558

区块链 策略模式

由于不知线程池的bug,某Java程序员叕被祭天

Java架构师迁哥

volatile,synchronized可见性,有序性,原子性代码证明(基础硬核)

叫练

volatile 多线程 synchronized 原子性 指令

Thinking Machines发布Tinker API,实现灵活的模型微调_AI&大模型_InfoQ精选文章