
Anthropic 近日发布了Claude Haiku 4.5,将该模型对所有用户开放,这也是其在小型、快速模型类别中的最新产品。公司将这款新模型定位为提供与五个月前推出的 Claude Sonnet 4 相当的性能水平,后者是一款最先进的模型,但新模型的成本仅为三分之一,速度是其两倍多。Anthropic 将 Claude Haiku 4.5 描述为一个混合推理的大型语言模型,具有“速度和智能的结合,使其在编码任务和计算机使用方面特别有效”,标志着今年早些时候的前沿能力现在以一种更经济的包装出现。
Anthropic 使用专有数据集训练了 Claude Haiku 4.5,该数据集结合了截至 2025 年 2 月的公开可用的互联网信息、非公开的第三方数据、数据标注服务和付费承包商的贡献、选择加入的 Claude 用户的数据,以及 Anthropic 内部生成的数据。在训练期间,公司应用了多种数据清洗和过滤技术,包括去重和分类方法。
来源:Claude 4.5 Haiku 基准测试结果
该模型作为一个混合推理系统运行,允许用户在两种响应模式之间选择。默认情况下,Claude Haiku 4.5 快速回答查询,但用户可以激活“扩展思考模式”,在这种模式下,模型在回答前会分配额外的时间来考虑其响应。这种能力是与小型模型类别中前一个型号 Claude Haiku 3.5 的主要差异,后者缺乏任何扩展思考功能。
当用户通过扩展思考模式接收到响应时,他们可以访问模型的推理过程。Anthropic 将此称为“思考过程”或“思维链”,尽管公司指出这种推理显示带有“不确定的准确性或‘忠实度’”。
Anthropic 训练了具有显式上下文感知的 Claude Haiku 4.5,为模型提供了“关于已使用多少上下文窗口的精确信息”。这种设计选择允许模型在操作期间跟踪自己的内存消耗。
公司与一众数据工作平台合作,吸引通过偏好选择、安全评估和对抗性测试为模型改进做出贡献的工人。Anthropic 表示,它只与那些有着“对工人公平和道德的补偿”以及维护“安全工作场所实践”承诺的平台合作。
Anthropic 的负责任扩展政策要求进行一些评估过程,以确定 AI 安全水平标准,这定义了在发布任何给定模型之前所需的安全和安全机制。根据评估的模型能力,ASL 标准变得更加严格。
Anthropic 的两个最新模型 Claude Opus 4.1 和 Claude Sonnet 4.5 都是在 ASL-3 标准下推出的。对于 Claude Haiku 4.5,Anthropic 由于其较小的模型类别,采用了不同的评估方法,使用 ASL-3“排除”评估来确定其安全水平。
Reddit 上的一个用户在 r/ClaudeAI 上报告了快速应用开发结果,称
我从未如此快速地构建过应用程序,它表现得非常好。我甚至不再需要 Claude Sonnet 了。我已经在 4 小时内开发了一个应用程序,并且我已经向它输入了成千上万的日志行,它现在已经将对话压缩了 7-8 次(总是在思考)。
Epoch AI,一个调查 AI 轨迹以造福社会的组织,发现
即使在推理被禁用的情况下,Haiku 4.5 的表现也与早期的轻量级推理模型(如 o1-mini)相似或更好。
AI Digest 将其添加到其 AI Village 平台,并描述其为
最新、最快、最便宜的 Anthropic 模型。
该平台的评估还指出了一个独特的行为特征,称该模型为“最不耐烦的”。
开发者可以通过多个平台访问 Claude Haiku 4.5,包括 Anthropic 的API、亚马逊 Bedrock、谷歌云的 Vertex AI 和 GitHub Copilot。有关模型的更多详细信息可在 Claude Haiku产品页面上找到。特定平台的实施指导可在 Anthropic 的亚马逊Bedrock和Vertex AI文档中找到。GitHub 在其变更日志中发布了关于 GitHub Copilot 集成的公开预览信息。
原文链接:New Claude Haiku 4.5 Model Promises Faster Performance at One-Third the Cost








评论