大厂Data+Agent 秘籍:腾讯/阿里/字节解析如何提升数据分析智能。 了解详情
写点什么

Llama 4 Scout 与 Maverick 现已在 Amazon Bedrock 和 SageMaker JumpStart 上线

  • 2025-05-21
    北京
  • 本文字数:777 字

    阅读完需:约 3 分钟

大小:383.32K时长:02:10
Llama 4 Scout与Maverick现已在Amazon Bedrock和SageMaker JumpStart上线

AWS 近日宣布,Meta 的最新基础模型 Llama 4 Scout 与 Llama 4 Maverick 已在 Amazon Bedrock 和 AWS SageMaker JumpStart 上线。两款模型均具备多模态能力,并采用混合专家(MoE)架构。

 

Meta 于去年四月发布的这两款模型分别包含 170 亿个活跃参数,分布在 16 个(Scout)和 128 个(Maverick)专家网络中。其中 Llama 4 Scout 针对单块英伟达 H100 GPU 通用任务进行了优化;而据 Meta 称,Llama 4 Maverick 在推理与编码能力方面表现突出,优于同类竞品。亚马逊特别强调了 MoE 架构在降低计算成本方面的价值:

 

得益于 Meta 首次采用更为高效的混合专家架构,该技术仅激活模型中与任务最相关的部分,客户能以更高计算效率进行模型训练和推理,在提升性能的同时降低成本。"

 

虽然 Llama 4 Scout 理论上支持 1000 万 token 的上下文窗口,但当前亚马逊 Bedrock 的限制为 350 万 token(官方表示将很快扩展);Llama 4 Maverick 则最高支持 100 万 token。相较于 Llama 3 系列 12.8 万 token 的上下文长度,两款模型均有显著提升。

 

在亚马逊 SageMaker JumpStart 平台,用户可根据需求通过 SageMaker Studio 或亚马逊 SageMaker Python SDK 调用新模型。两款模型默认使用配备英伟达 H100 Tensor Core GPU 的 ml.p5.48xlarge 实例,也可选择搭载英伟达 H200 Tensor Core GPU 的 ml.p5en.48xlarge 实例。Llama 4 Scout 还支持采用英伟达 L40S Tensor Core GPU 的 ml.g6e.48xlarge 实例类型。

 

在 AWS 之外,Llama 4 系列模型现已在 Databricks、GroqCloud、Lambda.ai、Cerebras Inference Cloud 等云平台上线,也可在 Hugging Face 平台使用

 

除 Scout 和 Maverick 外,Llama 4 家族还有第三款模型 Behemoth,该模型的 2880 亿活跃参数分布在 16 个专家网络中。Meta 表示当前还处于预览阶段的 Behemoth 是“最具智能的蒸馏教师模型”,Scout 与 Maverick 均是由其训练而来。

2025-05-21 14:007116

评论

发布
暂无评论
发现更多内容

Python 数据类型

HoneyMoose

【动态规划/总结必看】从一道入门题与你分享关于 DP 的分析技巧 ...

宫水三叶的刷题日记

面试 算法 LeetCode

事务消息应用场景、实现原理与项目实战(附全部源码)

中间件兴趣圈

RocketMQ 实战 消息中间件 事务消息

正则表达式.04 - 引用

insight

正则表达式 3月日更

Java8 Stream 数据流,大数据量下的性能效率怎么样?

xcbeyond

Java java8 Stream<T> 3月日更

Node.js 模块化你所需要知道的事

vivo互联网技术

大前端 nodejs Node

为什么我们开发 San 项目时要用 CLI?

百度开发者中心

进步

lenka

3月日更

(28DW-S8-Day17) 讲故事能力

mtfelix

28天写作 讲故事能力 复述能力

MindSpore:基于本地差分隐私的 Bandit 算法

华为云开发者联盟

算法 强化学习 mindspore Bandit 隐私

Hadoop 核心-HDFS的API详解

五分钟学大数据

大数据 hadoop hdfs 28天写作 3月日更

币宽量化交易软件开发|币宽炒币机器人系统APP开发

系统开发

《接口测试入门》 学习笔记

有梦想的tester

七日更 3月日更

如何在 Python 中清屏

HoneyMoose

看完张一鸣近十年微博,我总结了这些成长特质

邴越

字节跳动 张一鸣 互联网 职场 抖音

今日随想

Nydia

不一样的软件们——GitHub 热点速览 v.21.10

HelloGitHub

数据库 GitHub 开源

《精通比特币》学习笔记(第五章)

棉花糖

区块链 读书笔记 3月日更

鼎昂量化交易系统APP开发|鼎昂炒币机器人软件开发

系统开发

币神量化交易系统开发|币神量化交易APP软件开发

系统开发

CR量化交易APP开发|CR炒币机器人软件系统开发

系统开发

越来越受欢迎的Vue想学么,90后小姐姐今儿来教你

华为云开发者联盟

算法 Vue 大前端 框架 组件

落袋为安——前景理论之确定性

Justin

心理学 28天写作 游戏设计

算法喜刷刷

Kylin

算法 3月日更 21天挑战

3-8 工作日志

技术骨干

小赌怡情——激励不确定性效应

Justin

心理学 28天写作 游戏设计

2021年最新Redis面试题汇总

架构精进之路

redis 七日更 3月日更

Apache Sqoop中最重要的核心概念-导入导出

大数据技术指南

大数据 sqoop 28天写作 3月日更

Elasticsearch Dynamic Mapping

escray

elastic 七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试

网络知识一箩筐:IP地址划分的那些知识点

华为云开发者联盟

网络 虚拟私有云 子网 IP地址

干货分享丨从MPG 线程模型,探讨Go语言的并发程序

华为云开发者联盟

并发 channel goroutines MPG 线程 Go 语言

Llama 4 Scout与Maverick现已在Amazon Bedrock和SageMaker JumpStart上线_架构_Sergio De Simone_InfoQ精选文章