2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

新的 Claude Haiku 4.5 模型号称提供更快的速度与 1/3 的成本

作者:Vinod Goje

  • 2025-11-17
    北京
  • 本文字数:1423 字

    阅读完需:约 5 分钟

大小:713.86K时长:04:03
新的Claude Haiku 4.5模型号称提供更快的速度与1/3的成本

Anthropic 近日发布Claude Haiku 4.5,将该模型对所有用户开放,这也是其在小型、快速模型类别中的最新产品。公司将这款新模型定位为提供与五个月前推出的 Claude Sonnet 4 相当的性能水平,后者是一款最先进的模型,但新模型的成本仅为三分之一,速度是其两倍多。Anthropic 将 Claude Haiku 4.5 描述为一个混合推理的大型语言模型,具有“速度和智能的结合,使其在编码任务和计算机使用方面特别有效”,标志着今年早些时候的前沿能力现在以一种更经济的包装出现。

 

Anthropic 使用专有数据集训练了 Claude Haiku 4.5,该数据集结合了截至 2025 年 2 月的公开可用的互联网信息、非公开的第三方数据、数据标注服务和付费承包商的贡献、选择加入的 Claude 用户的数据,以及 Anthropic 内部生成的数据。在训练期间,公司应用了多种数据清洗和过滤技术,包括去重和分类方法。



来源:Claude 4.5 Haiku 基准测试结果

 

该模型作为一个混合推理系统运行,允许用户在两种响应模式之间选择。默认情况下,Claude Haiku 4.5 快速回答查询,但用户可以激活“扩展思考模式”,在这种模式下,模型在回答前会分配额外的时间来考虑其响应。这种能力是与小型模型类别中前一个型号 Claude Haiku 3.5 的主要差异,后者缺乏任何扩展思考功能。

 

当用户通过扩展思考模式接收到响应时,他们可以访问模型的推理过程。Anthropic 将此称为“思考过程”或“思维链”,尽管公司指出这种推理显示带有“不确定的准确性或‘忠实度’”。

 

Anthropic 训练了具有显式上下文感知的 Claude Haiku 4.5,为模型提供了“关于已使用多少上下文窗口的精确信息”。这种设计选择允许模型在操作期间跟踪自己的内存消耗。

 

公司与一众数据工作平台合作,吸引通过偏好选择、安全评估和对抗性测试为模型改进做出贡献的工人。Anthropic 表示,它只与那些有着“对工人公平和道德的补偿”以及维护“安全工作场所实践”承诺的平台合作。

 

Anthropic 的负责任扩展政策要求进行一些评估过程,以确定 AI 安全水平标准,这定义了在发布任何给定模型之前所需的安全和安全机制。根据评估的模型能力,ASL 标准变得更加严格。

 

Anthropic 的两个最新模型 Claude Opus 4.1 和 Claude Sonnet 4.5 都是在 ASL-3 标准下推出的。对于 Claude Haiku 4.5,Anthropic 由于其较小的模型类别,采用了不同的评估方法,使用 ASL-3“排除”评估来确定其安全水平。

 

Reddit 上的一个用户在 r/ClaudeAI 上报告了快速应用开发结果,称

 

我从未如此快速地构建过应用程序,它表现得非常好。我甚至不再需要 Claude Sonnet 了。我已经在 4 小时内开发了一个应用程序,并且我已经向它输入了成千上万的日志行,它现在已经将对话压缩了 7-8 次(总是在思考)。

 

Epoch AI,一个调查 AI 轨迹以造福社会的组织,发

 

即使在推理被禁用的情况下,Haiku 4.5 的表现也与早期的轻量级推理模型(如 o1-mini)相似或更好。

 

AI Digest 将其添加到其 AI Village 平台,并描述其为

 

最新、最快、最便宜的 Anthropic 模型。

 

该平台的评估还指出了一个独特的行为特征,称该模型为“最不耐烦的”。

 

开发者可以通过多个平台访问 Claude Haiku 4.5,包括 Anthropic 的API、亚马逊 Bedrock、谷歌云的 Vertex AI 和 GitHub Copilot。有关模型的更多详细信息可在 Claude Haiku产品页面上找到。特定平台的实施指导可在 Anthropic 的亚马逊BedrockVertex AI文档中找到。GitHub 在其变更日志中发布了关于 GitHub Copilot 集成的公开预览信息。

 

原文链接:New Claude Haiku 4.5 Model Promises Faster Performance at One-Third the Cost

2025-11-17 18:075

评论

发布
暂无评论

软件测试/测试开发全日制|Pytest结合Excel实现数据驱动

霍格沃兹测试开发学社

从像素到洞见:图像分类技术的全方位解读

不在线第一只蜗牛

机器学习 深度学习 图像 项目开发

传统 VC 机构,是否还能在 Fair launch 的散户牛市中胜出?

西柚子

🛠 开源即时通讯(IM)项目OpenIM源码部署指南

Geek_1ef48b

图扑物联 | WEB组态可视化软件

图扑物联

工业物联网 web组态软件 智慧污水处理 web scada 云组态

软件测试/测试开发/全日制/测试管理丨Allure测试报告特点与优势

测试人

软件测试

软件测试/测试开发全日制培训|Pytest的异常处理

霍格沃兹测试开发学社

2023 IoTDB Summit:天谋科技高级开发工程师张金瑞《筑其形:如何轻松搞定 IoTDB 数据建模》

Apache IoTDB

外贸企业为何要选择Yandex推广?

九凌网络

每日一题:LeetCode-198. 打家劫舍

Geek_4z9ami

面试 算法 LeetCode 动态规划 滚动数组

关于AI PC,英特尔CEO帕特·基辛格说了三个法则

E科讯

需要监控的五个主要加密货币趋势

区块链软件开发推广运营

区块链开发 链游开发 NFT开发 公链开发

软件测试/测试开发/全日制/测试管理丨Pytest常用插件

测试人

软件测试 自动化测试 测试开发 pytest

🛠 开源即时通讯(IM)项目OpenIM源码部署指南

Geek_1ef48b

坎昆升级在即,ZKFair 已开启 ZKF 质押

股市老人

低代码开发的困境与解药

飞算JavaAI开发助手

如何保护linux服务器远程使用的安全

德迅云安全杨德俊

SSH 远程

Kubernetes Pod配置:从基础到高级实战技巧

互联网工科生

Kubernetes

软件测试/测试开发全日制|Pytest结合yaml实现数据驱动

霍格沃兹测试开发学社

星耀新春,集星探宝,卡奥斯开源社区双节活动上线啦!

Openlab_cosmoplat

开源 活动

SpringBoot3 WebFlux 可观测最佳实践

观测云

链路追踪 spring boot3

虾皮API在电商营销活动中的应用与创新

技术冰糖葫芦

API

这些常见的python编码习惯,你都会吗

不在线第一只蜗牛

Python 编码 开发语言

如何利用 NFTScan Portfolio 功能分析钱包 NFT 持仓

NFT Research

NFT NFT\ NFTScan

端侧AI的“春风化雨手”,翻开中国科技下一页

脑极体

AI

新的Claude Haiku 4.5模型号称提供更快的速度与1/3的成本_AI&大模型_InfoQ精选文章