写点什么

Anthropic 发布 Claude 2.1 大模型,提供更宽的上下文窗口并支持 AI 工具

作者:Andrew Hoblitzell

  • 2023-12-14
    北京
  • 本文字数:1146 字

    阅读完需:约 4 分钟

大小:550.38K时长:03:07
Anthropic 发布 Claude 2.1 大模型,提供更宽的上下文窗口并支持 AI 工具

据 Anthropic 称,最新版本的 Claude 大模型为企业提供了许多“关键特性方面的进步,包括行业领先的 200K token 上下文窗口、模型幻觉率显著降低、系统提示词以及我们新开发的测试功能:支持外部工具”。Anthropic 还宣布了降价措施,以提升各款模型用户的成本效益。

 

增强的上下文窗口是 Claude 2.1 的一项亮点特性,其拥有 200,000 个 token 的容量,超过了 OpenAI 的 GPT-4,后者提供了 128,000 个 token 的窗口。Anthropic 表示,与之前的模型相比,新模型输出虚假陈述的可能性更小。Claude 2.1 会试图避免不正确的答案并承认一些问题存在不确定性,它输出相关答案时一般会选择提出质疑,而不是提供不正确的信息。Anthropic 表示,该模型输出的错误答案减少了 30%,并且模型错误地作出缺乏信源的判断的比率大大降低。



另一个值得注意的新增特性是 Claude 2.1 使用工具并与 API 交互的能力。该功能让模型能够利用计算器、数据库等外部资源,甚至执行网络搜索来更有效地响应查询。它还可以集成到用户的技术栈中,从而在各个领域中实现更多样化的应用。

 

此外,Claude 2.1 引入了系统提示词,使用户能够为其请求设置特定的上下文。此功能可确保模型的响应更加结构化且前后一致。现在模型的价格定为输入的提示词每百万 token 8 美元,模型输出则是每百万 token 24 美元,这样包括开发人员和企业在内的很多用户群体都能负担得起了。

 

一些用户对新模型的评价褒贬不一。从积极的一面来看,一些用户发现 Claude 2.1 非常适合聊天和摘要等任务,并赞扬了它的进步和功能改进,特别是在摘要任务方面。然而,其他用户也对该模型的拒绝响应情况和严格的审查表示失望,一些用户认为这让这款工具的实用性和自主性打了折扣。此外,由于严格的安全协议和内容指南,人们担心 Claude 在处理某些内容(例如学术或研究材料)方面存在局限性。



发现:

  • 在 200K 个 token(近 470 页)的情况下,Claude 2.1 能够回忆起某些文档级深度的事实

  • 文档最顶部和最底部的事实被回忆的准确率接近 100%

  • 位于文档顶部的事实的回忆性能低于底部(类似于 GPT-4)

  • 从 ~90K token 开始,文档底部的回忆性能开始变得越来越差

  • 无法保证短上下文长度下的性能 - Greg Kamradt


Anthropic 及时推出 Claude 2.1 的时机恰逢 OpenAI 的内部冲突时期,后者导致 ChatGPT Plus 订阅暂停购买,首席执行官 Sam Altman 也陷入了风波。尽管如此,Devin Coldewey 写道,“不管怎样,GPT-4 仍然是代码生成领域的黄金标准,Claude 处理输入请求的方式与竞争对手是不一样的,有些更好,有些更差。”

 

想要了解更多关于 Claude 2.1 细节的用户可以参考 Anthropic 网站上的模型介绍页面。 Anthropic 还制作了一个示例存储库,演示如何使用工具功能。

 

原文链接

https://www.infoq.com/news/2023/11/anthropic-announces-claude-2-1/

2023-12-14 12:576059

评论

发布
暂无评论
发现更多内容

下一代AI应用架构:LangChain工作流设计+70%内存优化方案

聚客AI学院

人工智能 agent langchain AI Agent AI 智能体

springboot项目集成dolphinscheduler调度器 实现datax数据同步任务

刘大猫

人工智能 算法 数据分析 DolphinScheduler 调度器

MCP 极简开发 读书笔记 1

wasa

淘宝图片搜索接口技术解析与Python实现

tbapi

淘宝图片搜索接口 淘宝拍立淘接口 天猫图片搜索接口 天猫拍立淘接口

ROG 绝神 RO姬x初音未来版电竞显示器与双模新品BW2025首秀!

新消费日报

霍尼韦尔战略性收购Li-ion Tamer以增强火灾探测技术,加强智能建筑产品组合

财见

数据不 Ready,一切 AI Ready 都是伪命题

袋鼠云数栈

数据库 大数据 数据治理 Data + AI 数据开发与治理

Mac电脑又卡又慢?一招解决,让你的电脑重获新生。

阿拉灯神丁

存储空间 电脑运行缓慢 如何清理Mac磁盘 CleanMyMac X中文版 苹果电脑系统优化

提示工程演进之旅

俞凡

人工智能 提示工程

系统综述:全同态加密友好的对称密码与密文转换技术

qife122

全同态加密 密文转换

第七在线成功入选中服协《2025中国服装行业创新推荐目录》

第七在线

巨头竞争,用户得利!大众CEO直言:有比亚迪这样的对手,最终受益的是顾客

爱极客侠

Mac读取不到移动硬盘的常见原因及有效解决方法

阿拉灯神丁

格式化 Mac 软件 NTFS磁盘管理器 Tuxera NTFS2024 磁盘格式读写软件

海信连续九年跻身凯度BrandZ中国全球化品牌十强

财见

【AI编程】AI+高德MCP不到10分钟搞定上海三日游

卷福同学

AI编程 cursor Trae

Perfectly Clear Video for Mac:一键焕活视频质感的神器

兮兮立立

基于强化学习的智能体自主决策

申公豹

智能体

Chunked-Prefills 分块预填充机制详解

Se7en

天猫商品详情API接口技术解析与Python实现

tbapi

天猫商品详情接口 天猫API 天猫商品数据采集

HR Path达成新收购,强化在德外包专长

财见

开普勒宣布完成A+轮融资,强势实现半年三轮融资

财见

智能网联 + AI:EMQX 5.10.0 大模型集成功能介绍

EMQ映云科技

人工智能 mqtt

深度RAG笔记01:核心概念与诞生背景

王翊仰

LLM rag

EMQX + Amazon S3 Tables:从实时物联网数据到数据湖仓

EMQ映云科技

mqtt Amazon S3

TeaCode for Mac:开发者的代码加速神器

兮兮立立

大数据-40 Redis 类型集合 string list set zsorted hash 详解

武子康

Java redis 大数据 分布式 后端

MIAOYUN | 每周AI新鲜事儿(07.04-07.11)

MIAOYUN

人工智能 云计算 AI 云原生 AI 原生

Web3支付App的技术框架

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

中烟创新灯塔大模型应用开发平台入选“2024年度百大AI产品”

中烟创新

全球MBA项目需求呈多样化趋势,考生偏好与项目类型高度关联

财见

华为入选2025年Gartner®文件与对象存储平台"客户之选",连续四年获此称号

财见

Anthropic 发布 Claude 2.1 大模型,提供更宽的上下文窗口并支持 AI 工具_生成式 AI_InfoQ精选文章