2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Thinking Machines 发布 Tinker API,实现灵活的模型微调

作者:Daniel Dominguez

  • 2025-10-11
    北京
  • 本文字数:845 字

    阅读完需:约 3 分钟

大小:406.10K时长:02:18
Thinking Machines发布Tinker API,实现灵活的模型微调

Thinking Machines 公司发布了Tinker,这是一个用于开放权重语言模型微调的 API。这项服务旨在帮助开发者减少基础设施开销,并提供托管的调度、GPU 分配和检查点处理等功能。通过抽象化集群管理,Tinker 使开发者可以通过简单的 Python 调用进行微调。

 

Tinker 支持多种模型架构,从小型模型到大型混合专家系统,如Qwen-235B-A22B。开发者可以通过更改 Python 代码中的一个字符串来微调模型。该 API 提供了像 forward_backward 和 sample 这样的原语,可以作为灵活的构建块用于后训练方法。该平台集成了LoRA,可以提高并行运行微调时 GPU 内存的利用率,对于研究小组和资源有限的团队来说,这很实用。

 

该公司还发布了Tinker Cookbook,这是一个使用该 API 实现常见微调技术的开源存储库。其中包括强化学习方法和偏好优化工作流。来自普林斯顿、斯坦福、伯克利和 Redwood Research 的早期用户已经将 Tinker 应用于定理证明、化学推理及多智能体强化学习等任务。

 

Tinker 进入的这个领域之前就已经有其他的微调解决方案,如Hugging Face的Trainer APIOpenAI的微调端点MosaicML的Composer。这些框架提供了更高层次的抽象或专注于特定的训练流程,而 Tinker 则侧重于暴露可以组合成新方法的低级原语,赋予开发者更多控制权,但不需要他们管理基础设施。

 

来自社区的最初反馈强调了灵活性和简单性之间的平衡。AI 专业人士Ignacio de Gregorio评论道:

 

这太棒了。RLaaS 正是企业所缺失的解决方案,它在实现目标的同时,还外包了最不利于企业发展的环节(分布式训练)。

 

Thinking Machines公司创始人Mira Murati指出:

 

Tinker 为研究人员带来了前沿工具,提供了清晰的抽象用于编写实验和训练流程,同时处理了分布式训练的复杂性。它支持创新研究、模型定制,并提供了可靠的基线。

 

目前,Tinker 尚处于封闭测试阶段。早期访问免费,后续将采用按使用量计费的模式。开发者和研究团队可直接向 Thinking Machines 申请访问权限。

 

声明:本文为 InfoQ 翻译,未经许可禁止转载。

 

原文链接:https://www.infoq.com/news/2025/10/thinking-machines-tinker/

2025-10-11 11:005446

评论

发布
暂无评论

科兴未来|2023“直通乌镇” 全球互联网大赛

科兴未来News

数智化底座正在成为当前竞争的焦点

用友BIP

数智底座

Kubernetes云原生实战:分布式GeaFlow实现图研发,构建第一个商业智能应用

TuGraphAnalytics

Kubernetes 云原生 k8s BI 商业智能

全新技术驱动预算管理全面升级

用友BIP

全面预算

从大数据到图计算-Graph On BigData

TuGraphAnalytics

GitHub 大数据 开源 图计算 GeaFlow

从混沌到秩序的蜕变,SRE解码云计算运维奥秘

鲸品堂

云计算 SRE SRE实践 企业号 7 月 PK 榜

一文搞懂Git,掌握日常命令和基本操作

互联网工科生

git 知识

我感兴趣的技术四剑客 | 社区征文

法医

前端 年中技术盘点

华为云GaussDB亮相2023可信数据库发展大会,荣获三项评测证书!

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

Pytorch: autograd与逻辑回归的实现

timerring

人工智能

云拨测全面升级丨单次拨测低至 0.001 元

阿里巴巴云原生

阿里云 云原生 可观测 云拨测

一辆没有“刹车”的跑车,你敢开多快?

原点安全

数据资产价值 数据安全管理 贴源保护

持续推进平台化、生态化用友助力数智化安全有效落地

用友BIP

信创 国产替代

使用第一性原理思维思考如何打造提高生产力的平台 | 京东云技术团队

京东科技开发者

数字化转型 平台工程 企业号 7 月 PK 榜

实例讲解看nsenter带你“上帝视角”看网络

华为云开发者联盟

开发 华为云 华为云开发者联盟 企业号 7 月 PK 榜

基于STM32的300W无刷直流电机驱动方案

元器件秋姐

驱动 无刷电机 直流电机 SMT32 FOC

NFTScan 成为 Binance NFT 官方 NFT 数据提供商

NFT Research

NFT\ API 接口

Mybatis-SQL分析组件 | 京东云技术团队

京东科技开发者

mybatis sql mybatis入门 企业号 7 月 PK 榜

APP流水线测试领域探索与最佳实践 | 京东物流技术团队

京东科技开发者

测试 app测试 app自动化测试 企业号 7 月 PK 榜

wrk - 本地压测工具实操

Monin

高性能 压测 性能调优 #性能测试 wrk

体系完整的数智化底座支撑企业创新发展,实现国产替代

用友BIP

国产替代

谁在以太坊区块链上循环交易?GeaFlow+Kafka的0元流图解决方案

TuGraphAnalytics

区块链 以太坊 kafka 图计算 GeaFlow

如果我是一个小白,怎么开发网页

猫九

前端

SpringIoc容器之Aware | 京东云技术团队

京东科技开发者

spring aware springloc Aware 接口 企业号 7 月 PK 榜

CST电磁仿真软件配置的CPU、内存、显卡显存越大越好吗?

思茂信息

cst cst使用教程 cst操作 cst电磁仿真 cst仿真软件

网易三个S级项目制作人,为什么选择在这个渠道“爆料”?

最新动态

谈谈分布式事务

Monin

分布式事务 微服务 云原生 事务 java 编程

七月创作之星挑战赛开始咯~

Openlab_cosmoplat

开源 开源社区 创作活动

掌握 Dubbo:入门教程

Apifox

程序员 gRPC dubbo RPC 开发

Thinking Machines发布Tinker API,实现灵活的模型微调_AI&大模型_InfoQ精选文章