【AICon】硅谷视野+中国实践,汇聚全球顶尖技术的 AI 科技盛会 >>> 了解详情
写点什么

Claude 3 震撼发布,这家云巨头同时宣布已接入该模型,全球开发者均可访问

  • 2024-03-08
    北京
  • 本文字数:2632 字

    阅读完需:约 9 分钟

大小:1.27M时长:07:22
Claude 3震撼发布,这家云巨头同时宣布已接入该模型,全球开发者均可访问

最近几日,Claude 3 的受关注度无人能敌。

 

这家总部位于旧金山的初创公司 Anthropic 发布了一款新的大型语言模型(LLM) Claude 3,据称是迄今为止世界上最强大的大模型,因为它在常规的基准测试中击败了之前的领导者 OpenAI 的 GPT—— 4 和谷歌的 Gemini。

 

Anthropic 官宣的三款 Claude 3 模型——按照智力从高到低的顺序分别命名为 Opus、Sonnet 和 Haiku。三个模型均提供 200k 长度的上下文,并针对不同的用例进行了优化:

 

  • Haiku 的优势在于速度和成本效益,这是一种快速紧凑的模型,具有近乎即时的响应能力。

  • Sonnet 在智能和速度之间实现了理想的平衡,适用于绝大多数工作负载,速度比 Claude 2 和 Claude 2.1 快 2 倍,且智能水平更高。它擅长执行需要快速响应的智能任务,例如知识检索或销售自动化。

  • Opus 是最先进、最强大的大模型,具有深度推理、高级数学和编码能力,在高度复杂的任务上具有顶级性能。它可以非常流畅地导航开放式提示和新颖场景,包括任务自动化、假设生成以及图表、图形和预测的分析。

 

有趣的是,新模型是根据合成数据进行训练的,即由人工智能本身生成的数据,而不是主要由人类作者生成的数据,这应该会消除一些人们对模型崩溃的担忧。


 Anthropic Claude 3 模型的智能与成本图。

 

Anthropic 的研究数据显示,Claude 3 Opus 作为其模型家族中最为智能的成员,已经在推理、数学和编程等领域树立了新标杆,超越了现有的其他模型,包括 OpenAI 的 GPT-4。具体来说,Opus 在人工智能系统的大多数常见评估基准上都优于同行,包括本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学(GSM8K)等。 下图是 Claude 3 与 GPT 和 Gemini 的基准测试成绩对比:

 


 资料来源:https ://www.anthropic.com/news/claude-3-family

 

Claude 3 的三类模型均提供了视觉功能,可以理解不同格式的结构化和非结构化数据,不仅是语言,还包括图像、图表、图表等,这使得企业能够构建集成不同多媒体源并解决真正跨领域问题的生成式人工智能应用程序。例如,制药公司可以查询药物研究论文以及蛋白质结构图,以加速发现;媒体组织可以自动生成图像标题或视频脚本。

 

值得一提的是,在 Claude 3 出现之前,幻觉现象是所有大模型的共同之痛,这一痛点在业内都没有特别有效的办法。而 Claude 3 模型通过“宪法 AI(Constitutional AI)”的训练方法原则为该 Claude 聊天机器人提供了明确的“价值观”,这些技术提供了对模型推理过程的透明度,并且提高了准确性。

 

此外,Claude 3 Opus 在困难的开放式问题上比 Claude 2.1 显示出 2 倍的预估准确性增益,降低了错误响应的可能性。随着企业客户依赖 Claude 跨越医疗、金融和法律研究等行业,减少幻觉现象对于安全性和性能至关重要。

 

这样的理念与亚马逊云科技倡导的以负责任的方式推进 AIGC 的发展不谋而合。事实上,早在去年亚马逊云科技就宣布向 Anthropic 投资 40 亿美元。除了通过 Amazon Bedrock 使用 Claude3 之外,用户也可以在 Anthropic 网站上访问 Claude 3。Amazon Bedrock 提供的领先 LLM 厂商的名单并不止 Anthropic 一家,包括 AI21 Labs、Cohere、Meta、Mistral、Stability 等大模型厂商提供的模型以及独占的 Amazon Titan 系列模型。


那么,利用 Amazon Bedrock 托管服务部署 Anthropic Claude 3 大模型的便捷之处?

 

据悉,Amazon Bedrock 已经推出了多项特色服务,包括模型评估功能能够帮助客户识别、比较和选择最适合的模型;知识库功能能够简化生成式 AI 应用构建并利用专有数据提供基于最新内容的定制化响应;模型调优功能支持对更多先进模型进行调优;代理功能可支持生成式 AI 应用在确保安全和隐私保护的情况下执行多步骤业务指令;Guardrails 功能可更好地帮助实现负责任 AI。这些功能为企业利用生成式 AI 提供多种选项,使得企业能够根据其业务和场景的特定需求,使用 Anthropic 的最新模型进行构建。这不仅包括自然语言模型,还包括扩展的多模式人工智能模型,能够跨文本、图像、图表等进行高级推理。

 

亚马逊云科技认为没有一种模型可以满足所有需求。为此,Amazon Bedrock 与全球领先的大模型供应商合作,为用户提供领先大模型选择,并在近日将大模型提供商扩充至 7 家。至此,Amazon Bedrock 的大模型供应商共有 AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon 和 Mistral AI,Mistral AI 的两种高性能模型 Mistral 7B 和 Mixtral 8x7B 也已经在 Amazon Bedrock 正式可用。Mistral 7B 是 Mistral AI 推出的首个基础模型,支持英语文本生成任务并具备自然编码能力。而 Mixtral 8x7B 则采用当下备受关注的 MoE(优质稀疏专家混合)技术,功能比 Mixtral 7B 更强大,可支持英语、法语、德语、西班牙语和意大利语文本生成任务并具备自然编码能力,非常适用于文本摘要、问题解答、文本分类、文本完善和代码补全等使用案例。

 

亚马逊云科技全球产品副总裁 Matt Wood 博士在其最新的博客文章中提到:“基础模型是未来 100 年最重要的软件组件之一。尽管生成式 AI 演示因其撰写博客文章或回答问题的能力而闻名(而且它们确实做得很好),但这些卓越的模型更应被视为能够重新定义我们与数据、信息以及彼此互动方式的推理和集成引擎。单独来看,Claude 3 在这些方面是行业领先的。在 Amazon Bedrock 中,这些模型与其他基础模型结合,获得了新的超能力,加上易于使用你自己的数据来定位响应、添加自主代理和可配置的安全护栏,其效果远大于各部分之和。”

 

Matt Wood 博士特别强调了 Claude3 模型在交互和安全方面的优势:“在交互方面,所有的 Claude 3 模型更容易被‘引导’,并且被设计得更好地支持流行的输出格式,如 JSON。这使得开发人员构建能够与 Claude 3 模型进行交互的应用程序变得更加容易。这些模型也不太可能拒绝回答那些处于模型安全边界边缘的提示,从而开放了更多企业用例,这些用例曾经可能因为模型的限制而被阻止。在安全方面,Claude 3 也保持了 Anthropic 的高安全标准。”

 

可见,此次宣布接入 Claude 3 模型是亚马逊云科技 更广泛战略的一部分,该战略旨在通过投资生成式 AI 堆栈的所有层(基础设施、模型和面向用户的应用程序)来抢占生成式 AI 领域的有利地位。亚马逊云科技表示,全球有超过 10,000 个组织已经在使用 Amazon Bedrock 来探索和部署生成式 AI 应用程序。

 

与此同时,有传言称 OpenAI 很快就会用自己对 Claude 3 的答案 GPT-5 进行反击,具体结果如何,我们可以拭目以待。

 

参考链接:

https://foresightnews.pro/article/detail/32716

https://aws.amazon.com/cn/blogs/machine-learning/unlocking-innovation-aws-and-anthropic-push-the-boundaries-of-generative-ai-together/

 

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2024-03-08 10:069002
用户头像
李冬梅 加V:busulishang4668

发布了 823 篇内容, 共 392.6 次阅读, 收获喜欢 1010 次。

关注

评论

发布
暂无评论

TDengine 3.2.3.0 版本发布,流计算等八大板块功能更新

TDengine

tdengine 时序数据库

成功入选CVPR2024!毫末提出一种基于摄像头的4D占据网格预测的Cam4DOcc新方案

Geek_2d6073

Golang微服务对接Spring-Cloud Gateway

于顾而言

golang Spring Cloud Gateway #微服务

2024上海国际第三代半导体技术及封测展览会

吹吹晚风

京东JD商品详情API引领电商智能化新潮流

技术冰糖葫芦

API 接口

简单聊聊租户隔离定义以及优势

行云管家

IT运维 租户 租户隔离

[自研开源] MyData 使用手册v0.7.1

LIEN

开源 数据集成 业务融合 API对接 mydata

2024上海国际个护美健电器展览会

吹吹晚风

揭秘QQ的AI绘画大模型技术——QQGC深度解析

百度开发者中心

大模型 绘画

2024中国(上海)国际嵌入式系统展览会

吹吹晚风

跨境电商的小语种数字人实现直播带货!

青否数字人

数字人

比特币BRC20铭文智能打币工具开发

薇電13242772558

BRC-20

RAG一文读懂!概念、场景、优势、对比微调与项目代码示例

飞桨PaddlePaddle

百度 BAIDU 百度飞桨 开发者说 rag

2024上海国际机器视觉技术及工业应用展览会

吹吹晚风

实时互动数字人系统源码的优势!

青否数字人

AI虚拟人直播带货的优势有哪些?

青否数字人

2024中国(上海)国际灯饰照明展览会

吹吹晚风

2024上海国际碳化硅及相关材料设备展览会

吹吹晚风

从原理到实践,拆解人工智能的神秘面纱

测吧(北京)科技有限公司

测试

长连接网关技术专题(十):百度基于Go的千万级统一长连接服务架构实践

JackJiang

即时通讯;IM;网络编程

NineData与OceanBase携手完成产品兼容认证,共筑企业级数据库新生态

NineData

数据库 oceanbase 兼容 NineData 奥星贝斯

探索基于Stable Diffusion的智能绘画大模型

百度开发者中心

人工智能 大模型 绘画工具

探索AI绘画的无限可能:一站式集成大模型工具

百度开发者中心

人工智能 大模型 AI绘画

义乌等保测评公司有哪些?用哪款堡垒机好?

行云管家

等保 义乌

直播预告|小白开箱: 云数据库在五朵云上的评测

NineData

评测 选型 云数据库 NineData 云猿生

2024上海国际网络直播与短视频产业展览会

吹吹晚风

2024上海国际新能源汽车功率半导体技术展览会

吹吹晚风

OpenTiny 妇女节限时特别活动来啦~

OpenTiny社区

开源 Vue 前端 低代码 组件库

Sharding-JDBC源码解析与vivo的定制开发

vivo互联网技术

源码解析 sharding-jdbc 定制开发

2024上海国际智慧触控与显示技术展览会

吹吹晚风

【技术探讨】无线通信模块拉距测试,是否一定要带笔记本电脑?

Geek_ab1536

Claude 3震撼发布,这家云巨头同时宣布已接入该模型,全球开发者均可访问_亚马逊云科技_李冬梅_InfoQ精选文章