写点什么

Thinking Machines 发布 Tinker API,实现灵活的模型微调

作者:Daniel Dominguez

  • 2025-10-11
    北京
  • 本文字数:845 字

    阅读完需:约 3 分钟

大小:406.10K时长:02:18
Thinking Machines发布Tinker API,实现灵活的模型微调

Thinking Machines 公司发布了Tinker,这是一个用于开放权重语言模型微调的 API。这项服务旨在帮助开发者减少基础设施开销,并提供托管的调度、GPU 分配和检查点处理等功能。通过抽象化集群管理,Tinker 使开发者可以通过简单的 Python 调用进行微调。

 

Tinker 支持多种模型架构,从小型模型到大型混合专家系统,如Qwen-235B-A22B。开发者可以通过更改 Python 代码中的一个字符串来微调模型。该 API 提供了像 forward_backward 和 sample 这样的原语,可以作为灵活的构建块用于后训练方法。该平台集成了LoRA,可以提高并行运行微调时 GPU 内存的利用率,对于研究小组和资源有限的团队来说,这很实用。

 

该公司还发布了Tinker Cookbook,这是一个使用该 API 实现常见微调技术的开源存储库。其中包括强化学习方法和偏好优化工作流。来自普林斯顿、斯坦福、伯克利和 Redwood Research 的早期用户已经将 Tinker 应用于定理证明、化学推理及多智能体强化学习等任务。

 

Tinker 进入的这个领域之前就已经有其他的微调解决方案,如Hugging Face的Trainer APIOpenAI的微调端点MosaicML的Composer。这些框架提供了更高层次的抽象或专注于特定的训练流程,而 Tinker 则侧重于暴露可以组合成新方法的低级原语,赋予开发者更多控制权,但不需要他们管理基础设施。

 

来自社区的最初反馈强调了灵活性和简单性之间的平衡。AI 专业人士Ignacio de Gregorio评论道:

 

这太棒了。RLaaS 正是企业所缺失的解决方案,它在实现目标的同时,还外包了最不利于企业发展的环节(分布式训练)。

 

Thinking Machines公司创始人Mira Murati指出:

 

Tinker 为研究人员带来了前沿工具,提供了清晰的抽象用于编写实验和训练流程,同时处理了分布式训练的复杂性。它支持创新研究、模型定制,并提供了可靠的基线。

 

目前,Tinker 尚处于封闭测试阶段。早期访问免费,后续将采用按使用量计费的模式。开发者和研究团队可直接向 Thinking Machines 申请访问权限。

 

声明:本文为 InfoQ 翻译,未经许可禁止转载。

 

原文链接:https://www.infoq.com/news/2025/10/thinking-machines-tinker/

2025-10-11 11:002

评论

发布
暂无评论

OpenGauss与NVM

daydayup

一文详述流媒体传输网络MediaUni

阿里云CloudImagine

云计算 视频云

NKD:容器云集群与 OS 一体化运维利器

openEuler

Linux Kubernetes 云原生 操作系统 openEuler

Java日记——使用强大的Elastisearch搜索引擎

java易二三

Java 编程 程序员 计算机

SSM框架——使用MyBatis Generator自动创建代码

java易二三

编程 程序员 mybatis 计算机

透过源码,捋清楚循环依赖到底是如何解决的!

江南一点雨

Java spring

【我和openGauss的故事】SpringBoot连接openGauss项目实战

daydayup

选择FastAPI或Flask:Python Web开发框架的终极指南

Apifox

Python flask 框架 web开发 FastApi

国产 etl engine 监控面板 为管理者掌握平台运行情况,决策执行方案提供即时数据支撑

weigeonlyyou

数据库 数据交换 物联网 ETL 云数据迁移

GitOps 与 DevOps:了解关键差异,为企业做出最佳选择

SEAL安全

DevOps 运维 gitops 企业号 8 月 PK 榜

明道云联合Kyligence结合示范性场景应用

明道云

【我和openGauss的故事】openGauss 5.0.0企业版两节点CM高可用实践

daydayup

【我和openGauss的故事】openGauss集群故障节点替换操作

daydayup

【我与openGauss的故事系列】openGauss 5.0.0全密态数据库应用小试

daydayup

【我和openGauss的故事】openGauss容灾集群搭建过程代码学习记录

daydayup

内卷和躺平之外,职场还有其他选择

老张

职场成长

分享实录 | 将 NGINX 打造成功能强大的 API 网关(上)

NGINX开源社区

nginx 微服务 k8s API api 网关

OpenSSL 3.0.0 设计(二)|Core 和 Provider 设计

铜锁开源密码库

开源 开发者 算法 信息安全 密码学

JSP的内置对象

java易二三

编程 程序员 计算机

移动云操作系统改造技术实践分享,跨操作系统云主机迁移优化(一)

openEuler

Linux centos 操作系统 迁移 openEuler

BenchmarkSQL 5.0 压测 openGauss 5.0.0 案例分享

daydayup

山东布谷科技直播系统源码热点分析:不同芯片实现高质量编码与渲染视频的GPU加速功能

山东布谷科技

英特尔CEO称AI PC时代于今秋开启 联想将首批发布

E科讯

鸿蒙智联再出发,携手伙伴共赢空间智能化,创造无限可能

HarmonyOS开发者

HarmonyOS

Java中final、finally和finalize的区别

java易二三

Java 程序员 计算机 final

买量业务福音:自有App运行小游戏

FinFish

小游戏 App运行小游戏 游戏买量

北航基于openEuler构建工业机器人操作系统,打造“开箱即用”的机器人基础软件平台

openEuler

Linux 操作系统 机器人 嵌入式 openEuler

Thinking Machines发布Tinker API,实现灵活的模型微调_AI&大模型_InfoQ精选文章