10 月 23 - 25 日,QCon 上海站即将召开,现在大会已开始正式报名,可以享受 8 折优惠 了解详情
写点什么

Unsloth 教程致力于简化 LLM 的对比和微调

作者:Patrick Farry

  • 2025-08-26
    北京
  • 本文字数:1040 字

    阅读完需:约 3 分钟

大小:198.01K时长:01:07
Unsloth教程致力于简化LLM的对比和微调

在最近的一篇 Reddit 文章中,Unsloth 发布了他们支持的所有开放模型的全面教程。该教程可以用来比较这些模型的优势和劣势,以及它们的性能基准。

 

这些教程涵盖了许多广泛使用的开放模型家族,比如 Qwen、Kimi、DeepSeek、Mistral、Phi、Gemma 和 Llama。这些教程对于寻找模型选择指导的架构师、机器学习科学家和开发人员非常有用,其次是关于微调、量化和强化学习的指导。

 

对于每个模型,教程都包含了模型的描述以及它能良好支持的用例。例如:


Qwen3-Coder-480B-A35B 在代理编码和代码任务方面提供了 SOTA(state of the art)的优势,匹配或超越了 Claude Sonnet-4、GPT-4.1 和Kimi K2。480B 模型在 Aider Polygot 上达到了 61.8%,并支持 256K 的 token 上下文,可扩展到 100 万个 token。

 

另外,教程提供了如何在 llama.cpp、Ollama 和 OpenWebUI 上运行模型的指导,包括推荐的参数和系统提示。教程提供了如何为 Unsloth 用户微调模型的指导和资源。


对于 Gemma 3n 和 Ollama,指导如下:


如果你还没有安装 ollama,请使用如下命令安装!



运行模型!注意,如果失败,你可以在另一个终端调用 ollama 服务器!我们在 Hugging Face 上传的参数中包含了我们所有的修复和建议参数(温度等)!



微调指导专门针对 Unsloth 平台,它提供了解决模型实现潜在问题的实际提示。例如,Gemma 3n 微调指南包括以下评论:


Gemma 3n 和 Gemma 3一样,在 Colab 中的 Flotat16 GPU(如 Tesla T4)上运行时遇到了问题。如果你不为推理或微调修复 Gemma 3n,你会遇到 NaN 和无穷大的问题。更多信息如下

[...]

我们还发现,由于 Gemma 3n 的独特架构在视觉编码器中重用了隐藏状态,它在梯度检查点(Gradient Checkpointing)方面会带来了另一个有趣的现象,如下所述。


像 Unsloth 和 Axolotl 这样的开源微调框架创建者,希望减少团队为特定用例创建模型所需的时间。

 

对于使用其他微调框架和模型生态系统(如 AWS)的用户来说,他们应该也能发现这些教程对于运行模型的指导和它们能力的总结会很有用。

 

Unsloth 是一家成立于 2023 年的旧金山初创公司,它在 Hugging Face Hub 上提供了一系列开放的微调和量化模型。这些模型是为特定目的训练的,如代码生成或代理工具支持。量化意味着它们在推理模式下运行会更便宜。Unsloth 文档解释了系统的目的是简化“在本地和[云]平台上的模型训练。我们简化的工作流程处理了从模型加载和量化到训练、评估、保存、导出和与推理引擎集成的所有事情。”

 

你可以在公司网站上找到Unsloth初学者指南

 

原文链接:

Unsloth Tutorials Aim to Make it Easier to Compare and Fine-tune LLMs


2025-08-26 13:541

评论

发布
暂无评论

企业AI应用行动指南2024

易观分析

抖音电商数据接口全解析:如何高效获取商品信息

tbapi

抖音 抖音商品详情数据接口 抖音数据采集

超越Devin!姚班带队,他们创大模型编程新世界纪录

Openlab_cosmoplat

人工智能 智能 ChatGPT

度安讲 | 第二期「安全左移·业务护航」技术沙龙成功举办

百度安全

李尔将收购西班牙自动化和智能公司WIP Industrial Automation

财见

Python优化、异常处理与性能提升技巧

我再BUG界嘎嘎乱杀

Python 编程 后端 开发语言

Amazon Q Developer 实战:从新代码生成到遗留代码优化(下)

亚马逊云科技 (Amazon Web Services)

人工智能 生成式人工智能

专访顺丰科技产品专家:物流能力乐高化

新消费日报

Spring Security 注册过滤器注意事项

江南一点雨

Java spring spring security

Apache IoTDB 分布式架构三部曲(二)分片与负载均衡

Apache IoTDB

F5G城市光网,助力“一网通城”筑基数字中国

脑极体

AI 网络

解析 AI 时代广告素材格局:AppsFlyer 综合报告揭示行业关键数据洞察

财见

数据库与低代码开发:技术革新与应用实践

不在线第一只蜗牛

数据挖掘 数据库 低代码

2024ERP系统厂商大盘点!

优秀

ERP ERP系统

近期京东开发者最受欢迎的 10 篇文章,内附大量热门岗位招聘

京东科技开发者

多云世界中的 API 治理

幂简集成

API 多云 API治理

昆仑万维开源2千亿稀疏大模型天工MoE,全球首创能用4090推理

新消费日报

望繁信科技「流程资产」的全面定义正式公开!含金量巨大,赶紧下载!

望繁信科技

流程挖掘 流程资产 流程智能 流程资产白皮书 流程资产报告

软件测试学习笔记丨Flask操作数据库-对象与数据模型

测试人

软件测试

天谋科技参与编写墨天轮《2023 年中国数据库行业年度分析报告》

Apache IoTDB

构建Python构建自动化测试框架(原理与实践)

我再BUG界嘎嘎乱杀

Python 软件测试 自动化测试

GitHub上新!14个Python项目详细教程(附完整代码)

我再BUG界嘎嘎乱杀

Python 后端 入门 开发语言 零基础

Unsloth教程致力于简化LLM的对比和微调_AI&大模型_InfoQ精选文章