写点什么

新的 Claude Haiku 4.5 模型号称提供更快的速度与 1/3 的成本

作者:Vinod Goje

  • 2025-11-17
    北京
  • 本文字数:1423 字

    阅读完需:约 5 分钟

大小:713.86K时长:04:03
新的Claude Haiku 4.5模型号称提供更快的速度与1/3的成本

Anthropic 近日发布Claude Haiku 4.5,将该模型对所有用户开放,这也是其在小型、快速模型类别中的最新产品。公司将这款新模型定位为提供与五个月前推出的 Claude Sonnet 4 相当的性能水平,后者是一款最先进的模型,但新模型的成本仅为三分之一,速度是其两倍多。Anthropic 将 Claude Haiku 4.5 描述为一个混合推理的大型语言模型,具有“速度和智能的结合,使其在编码任务和计算机使用方面特别有效”,标志着今年早些时候的前沿能力现在以一种更经济的包装出现。

 

Anthropic 使用专有数据集训练了 Claude Haiku 4.5,该数据集结合了截至 2025 年 2 月的公开可用的互联网信息、非公开的第三方数据、数据标注服务和付费承包商的贡献、选择加入的 Claude 用户的数据,以及 Anthropic 内部生成的数据。在训练期间,公司应用了多种数据清洗和过滤技术,包括去重和分类方法。



来源:Claude 4.5 Haiku 基准测试结果

 

该模型作为一个混合推理系统运行,允许用户在两种响应模式之间选择。默认情况下,Claude Haiku 4.5 快速回答查询,但用户可以激活“扩展思考模式”,在这种模式下,模型在回答前会分配额外的时间来考虑其响应。这种能力是与小型模型类别中前一个型号 Claude Haiku 3.5 的主要差异,后者缺乏任何扩展思考功能。

 

当用户通过扩展思考模式接收到响应时,他们可以访问模型的推理过程。Anthropic 将此称为“思考过程”或“思维链”,尽管公司指出这种推理显示带有“不确定的准确性或‘忠实度’”。

 

Anthropic 训练了具有显式上下文感知的 Claude Haiku 4.5,为模型提供了“关于已使用多少上下文窗口的精确信息”。这种设计选择允许模型在操作期间跟踪自己的内存消耗。

 

公司与一众数据工作平台合作,吸引通过偏好选择、安全评估和对抗性测试为模型改进做出贡献的工人。Anthropic 表示,它只与那些有着“对工人公平和道德的补偿”以及维护“安全工作场所实践”承诺的平台合作。

 

Anthropic 的负责任扩展政策要求进行一些评估过程,以确定 AI 安全水平标准,这定义了在发布任何给定模型之前所需的安全和安全机制。根据评估的模型能力,ASL 标准变得更加严格。

 

Anthropic 的两个最新模型 Claude Opus 4.1 和 Claude Sonnet 4.5 都是在 ASL-3 标准下推出的。对于 Claude Haiku 4.5,Anthropic 由于其较小的模型类别,采用了不同的评估方法,使用 ASL-3“排除”评估来确定其安全水平。

 

Reddit 上的一个用户在 r/ClaudeAI 上报告了快速应用开发结果,称

 

我从未如此快速地构建过应用程序,它表现得非常好。我甚至不再需要 Claude Sonnet 了。我已经在 4 小时内开发了一个应用程序,并且我已经向它输入了成千上万的日志行,它现在已经将对话压缩了 7-8 次(总是在思考)。

 

Epoch AI,一个调查 AI 轨迹以造福社会的组织,发

 

即使在推理被禁用的情况下,Haiku 4.5 的表现也与早期的轻量级推理模型(如 o1-mini)相似或更好。

 

AI Digest 将其添加到其 AI Village 平台,并描述其为

 

最新、最快、最便宜的 Anthropic 模型。

 

该平台的评估还指出了一个独特的行为特征,称该模型为“最不耐烦的”。

 

开发者可以通过多个平台访问 Claude Haiku 4.5,包括 Anthropic 的API、亚马逊 Bedrock、谷歌云的 Vertex AI 和 GitHub Copilot。有关模型的更多详细信息可在 Claude Haiku产品页面上找到。特定平台的实施指导可在 Anthropic 的亚马逊BedrockVertex AI文档中找到。GitHub 在其变更日志中发布了关于 GitHub Copilot 集成的公开预览信息。

 

原文链接:New Claude Haiku 4.5 Model Promises Faster Performance at One-Third the Cost

2025-11-17 18:074882

评论

发布
暂无评论

Prometheus 2.23.0 新特性

耳东@Erdong

Prometheus 9月日更

CentOS7 Linux实用命令

Mike

手撸二叉树之从前序与中序遍历序列构造二叉树

HelloWorld杰少

9月日更

模块八作业

Mr.He

架构实战营

如何使用协程与生命周期感知型组件结合使用

Changing Lin

9月日更

序列化与反序列化系列二:JPA与Querydsl

程序员架构进阶

架构 9月日更 QueryDSL Spring JPA

纯CSS实现『斑马纹理投影文字』

德育处主任

CSS css3 大前端 纯CSS

架构实战营 - 模块八作业

Julian Chu

架构实战营模块八作业-消息队列存储数据的MYSQL设计

王晓宇

架构实战营

敏捷开发模式下测试经理没有了话语权?

BY林子

敏捷测试 敏捷转型

数字经济成为经济高质量发展的重要推动力

CECBC

全场景进化与无缝协同:荣耀的高端化势能进程

脑极体

架构1期模块八作业

五只羊

架构实战营

什么是网络安全等级保护

网络安全学海

网络安全 信息安全 WEB安全 等级保护 黑客、

linux之sshpass命令

入门小站

Linux

我,35岁程序员,离职前是这么做的

梦想橡皮擦

9月日更

JavaScript进阶(四)防抖

Augus

JavaScript 9月日更

完成年初的一个小目标:七个月体重复盘

石云升

减肥 9月日更

链政经济:区块链如何服务新时代治国理政

CECBC

架构实战营作业 -- 模块三

冬瓜茶

🏆【算法数据结构专题】「限流算法专项」带你认识常用的限流算法的技术指南(分析篇)

码界西柚

ratelimiter 限流算法 9月日更 限流器

在线JSON转Go Bson工具

入门小站

工具

Vue进阶(幺贰幺):ElementUI 表单校验注意事项

No Silver Bullet

Vue elementUI 表单校验 9月日更

千万级学生管理系统的考试试卷存储方案

穿裤子的云

网络攻防学习笔记 Day141

穿过生命散发芬芳

网络安全 9月日更

设计消息队列存储消息数据的MySQL 表格

feitian

Zookeeper配置管理自动更新

Mike

NFT 这么火,你知道 ERC721 么

Rayjun

以太坊 ERC ERC721

假期的的生活?

卢卡多多

假期 9月日更

测试常用英语(持续更新中)

IT蜗壳-Tango

9月日更

数据安全

奔向架构师

数据仓库 数据安全 9月日更

新的Claude Haiku 4.5模型号称提供更快的速度与1/3的成本_AI&大模型_InfoQ精选文章