写点什么

Unsloth 教程致力于简化 LLM 的对比和微调

作者:Patrick Farry

  • 2025-08-26
    北京
  • 本文字数:1040 字

    阅读完需:约 3 分钟

大小:198.01K时长:01:07
Unsloth教程致力于简化LLM的对比和微调

在最近的一篇 Reddit 文章中,Unsloth 发布了他们支持的所有开放模型的全面教程。该教程可以用来比较这些模型的优势和劣势,以及它们的性能基准。

 

这些教程涵盖了许多广泛使用的开放模型家族,比如 Qwen、Kimi、DeepSeek、Mistral、Phi、Gemma 和 Llama。这些教程对于寻找模型选择指导的架构师、机器学习科学家和开发人员非常有用,其次是关于微调、量化和强化学习的指导。

 

对于每个模型,教程都包含了模型的描述以及它能良好支持的用例。例如:


Qwen3-Coder-480B-A35B 在代理编码和代码任务方面提供了 SOTA(state of the art)的优势,匹配或超越了 Claude Sonnet-4、GPT-4.1 和Kimi K2。480B 模型在 Aider Polygot 上达到了 61.8%,并支持 256K 的 token 上下文,可扩展到 100 万个 token。

 

另外,教程提供了如何在 llama.cpp、Ollama 和 OpenWebUI 上运行模型的指导,包括推荐的参数和系统提示。教程提供了如何为 Unsloth 用户微调模型的指导和资源。


对于 Gemma 3n 和 Ollama,指导如下:


如果你还没有安装 ollama,请使用如下命令安装!



运行模型!注意,如果失败,你可以在另一个终端调用 ollama 服务器!我们在 Hugging Face 上传的参数中包含了我们所有的修复和建议参数(温度等)!



微调指导专门针对 Unsloth 平台,它提供了解决模型实现潜在问题的实际提示。例如,Gemma 3n 微调指南包括以下评论:


Gemma 3n 和 Gemma 3一样,在 Colab 中的 Flotat16 GPU(如 Tesla T4)上运行时遇到了问题。如果你不为推理或微调修复 Gemma 3n,你会遇到 NaN 和无穷大的问题。更多信息如下

[...]

我们还发现,由于 Gemma 3n 的独特架构在视觉编码器中重用了隐藏状态,它在梯度检查点(Gradient Checkpointing)方面会带来了另一个有趣的现象,如下所述。


像 Unsloth 和 Axolotl 这样的开源微调框架创建者,希望减少团队为特定用例创建模型所需的时间。

 

对于使用其他微调框架和模型生态系统(如 AWS)的用户来说,他们应该也能发现这些教程对于运行模型的指导和它们能力的总结会很有用。

 

Unsloth 是一家成立于 2023 年的旧金山初创公司,它在 Hugging Face Hub 上提供了一系列开放的微调和量化模型。这些模型是为特定目的训练的,如代码生成或代理工具支持。量化意味着它们在推理模式下运行会更便宜。Unsloth 文档解释了系统的目的是简化“在本地和[云]平台上的模型训练。我们简化的工作流程处理了从模型加载和量化到训练、评估、保存、导出和与推理引擎集成的所有事情。”

 

你可以在公司网站上找到Unsloth初学者指南

 

原文链接:

Unsloth Tutorials Aim to Make it Easier to Compare and Fine-tune LLMs


2025-08-26 13:544241

评论

发布
暂无评论

Java不支持协程?那是你不知道Quasar!

码农参上

协程 Java后端

如何为政企移动办公加上一道“安全锁”?

BeeWorks

VHEDT业务发展框架

凌晞

框架 构架

2022年中国重卡智能化升级专题研究

易观分析

智能汽车

IntelliJ IDEA中有什么让你相见恨晚的好用插件?

Jackpop

DAP事实表加工汇总功能应用说明

agileai

数据分析 数据集成 数仓建设 基础事实表 汇总事实表

华为云招募工业智能领域合作伙伴,强力扶持+商业变现

华为云开发者联盟

云计算 华为云 工业数据智能

如何低成本快速搭建企业知识库?

小炮

什么是RESTful,REST api设计时应该遵守什么样的规则?

wljslmz

RESTful 6月月更

网页制作存在的一些难点

源字节1号

博睿数据出席阿里云可观测技术峰会,数字体验管理驱动可持续发展

博睿数据

可观测性 智能运维 博睿数据 数字体验管理

web技术分享| 【高德地图】实现自定义的轨迹回放

anyRTC开发者

前端 Web 音视频 地图 轨迹回放

关河因果将机器学习融合逻辑规则,突破黑盒壁垒

6979阿强

数据分析 大数据分析 关河因果 关河智图 因果分析

年中大促 | 集成无忧,超值套餐 6 折起

融云 RongCloud

视频爆炸时代,谁在支撑视频生态网高速运行?

郑州埃文科技

flow IP地址 NetFlow

企业级软件开发新模式:低代码

力软低代码开发平台

万字攻略,详解腾讯面试(T1-T9)核心技术点,面试题整理

C++后台开发

后台开发 面试题 Linux服务器开发 C++后台开发 腾讯面试

预约直播|机器学习PAI:AI加速计划

阿里云大数据AI技术

AI 模型开发训练

Vue-17-组件

Python研究所

6月月更

详解openGauss多线程架构启动过程

华为云开发者联盟

数据库 后端

活动预约|阿里云如何搭建云服务 SRE 与可观测体系

阿里巴巴云原生

阿里云 云原生 可观测 峰会

学习 | 写论文看这一篇就够了~

写程序的小王叔叔

学习笔记 论文阅读 论文写作 6月月更

5分钟快速上线Web应用和API(Vercel)

Liam

前端 前端开发 开发 Postman API

短视频源码开发,优质的短视频源码需要做好哪几点?

开源直播系统源码

软件开发 短视频源码

再读凤凰架构-分布式架构更清晰

AiDaddy

分布式 凤凰架构

洞见科技牵头的全球「首个」IEEE隐私计算「互联互通」国际标准正式启动

洞见科技

隐私计算 IEEE 互联互通

机器学习实践:基于支持向量机算法对鸢尾花进行分类

华为云开发者联盟

人工智能 模型 华为云

如何做好研发效能度量及指标选取

思码逸研发效能

研发效能

[译]关于 Python 中的数字你可能不知道的 3 件事

宇宙之一粟

Python 6月月更

如何给研发团队分钱?

菜根老谭

研发体系 绩效管理 激励体系

物联网开源开发平台 Shifu 开放内测!第一版技术文档发布

亚马逊云科技 (Amazon Web Services)

物联网 Tech 专栏

Unsloth教程致力于简化LLM的对比和微调_AI&大模型_InfoQ精选文章