新的Claude Haiku 4.5模型号称提供更快的速度与1/3的成本

Anthropic 近日发布了Claude Haiku 4.5，将该模型对所有用户开放，这也是其在小型、快速模型类别中的最新产品。公司将这款新模型定位为提供与五个月前推出的 Claude Sonnet 4 相当的性能水平，后者是一款最先进的模型，但新模型的成本仅为三分之一，速度是其两倍多。Anthropic 将 Claude Haiku 4.5 描述为一个混合推理的大型语言模型，具有“速度和智能的结合，使其在编码任务和计算机使用方面特别有效”，标志着今年早些时候的前沿能力现在以一种更经济的包装出现。

Anthropic 使用专有数据集训练了 Claude Haiku 4.5，该数据集结合了截至 2025 年 2 月的公开可用的互联网信息、非公开的第三方数据、数据标注服务和付费承包商的贡献、选择加入的 Claude 用户的数据，以及 Anthropic 内部生成的数据。在训练期间，公司应用了多种数据清洗和过滤技术，包括去重和分类方法。

来源：Claude 4.5 Haiku 基准测试结果

该模型作为一个混合推理系统运行，允许用户在两种响应模式之间选择。默认情况下，Claude Haiku 4.5 快速回答查询，但用户可以激活“扩展思考模式”，在这种模式下，模型在回答前会分配额外的时间来考虑其响应。这种能力是与小型模型类别中前一个型号 Claude Haiku 3.5 的主要差异，后者缺乏任何扩展思考功能。

当用户通过扩展思考模式接收到响应时，他们可以访问模型的推理过程。Anthropic 将此称为“思考过程”或“思维链”，尽管公司指出这种推理显示带有“不确定的准确性或‘忠实度’”。

Anthropic 训练了具有显式上下文感知的 Claude Haiku 4.5，为模型提供了“关于已使用多少上下文窗口的精确信息”。这种设计选择允许模型在操作期间跟踪自己的内存消耗。

公司与一众数据工作平台合作，吸引通过偏好选择、安全评估和对抗性测试为模型改进做出贡献的工人。Anthropic 表示，它只与那些有着“对工人公平和道德的补偿”以及维护“安全工作场所实践”承诺的平台合作。

Anthropic 的负责任扩展政策要求进行一些评估过程，以确定 AI 安全水平标准，这定义了在发布任何给定模型之前所需的安全和安全机制。根据评估的模型能力，ASL 标准变得更加严格。

Anthropic 的两个最新模型 Claude Opus 4.1 和 Claude Sonnet 4.5 都是在 ASL-3 标准下推出的。对于 Claude Haiku 4.5，Anthropic 由于其较小的模型类别，采用了不同的评估方法，使用 ASL-3“排除”评估来确定其安全水平。

Reddit 上的一个用户在 r/ClaudeAI 上报告了快速应用开发结果，称

我从未如此快速地构建过应用程序，它表现得非常好。我甚至不再需要 Claude Sonnet 了。我已经在 4 小时内开发了一个应用程序，并且我已经向它输入了成千上万的日志行，它现在已经将对话压缩了 7-8 次（总是在思考）。

Epoch AI，一个调查 AI 轨迹以造福社会的组织，发现

即使在推理被禁用的情况下，Haiku 4.5 的表现也与早期的轻量级推理模型（如 o1-mini）相似或更好。

AI Digest 将其添加到其 AI Village 平台，并描述其为

最新、最快、最便宜的 Anthropic 模型。

该平台的评估还指出了一个独特的行为特征，称该模型为“最不耐烦的”。

开发者可以通过多个平台访问 Claude Haiku 4.5，包括 Anthropic 的API、亚马逊 Bedrock、谷歌云的 Vertex AI 和 GitHub Copilot。有关模型的更多详细信息可在 Claude Haiku产品页面上找到。特定平台的实施指导可在 Anthropic 的亚马逊Bedrock和Vertex AI文档中找到。GitHub 在其变更日志中发布了关于 GitHub Copilot 集成的公开预览信息。

原文链接：New Claude Haiku 4.5 Model Promises Faster Performance at One-Third the Cost

创作场景

新的 Claude Haiku 4.5 模型号称提供更快的速度与 1/3 的成本