燃爆上海 5·23-24,AICon 大模型实战风暴,50+ 干货一网打尽,即将开幕~ 了解详情
写点什么

Llama 4 Scout 与 Maverick 现已在 Amazon Bedrock 和 SageMaker JumpStart 上线

  • 2025-05-21
    北京
  • 本文字数:777 字

    阅读完需:约 3 分钟

大小:383.32K时长:02:10
Llama 4 Scout与Maverick现已在Amazon Bedrock和SageMaker JumpStart上线

AWS 近日宣布,Meta 的最新基础模型 Llama 4 Scout 与 Llama 4 Maverick 已在 Amazon Bedrock 和 AWS SageMaker JumpStart 上线。两款模型均具备多模态能力,并采用混合专家(MoE)架构。

 

Meta 于去年四月发布的这两款模型分别包含 170 亿个活跃参数,分布在 16 个(Scout)和 128 个(Maverick)专家网络中。其中 Llama 4 Scout 针对单块英伟达 H100 GPU 通用任务进行了优化;而据 Meta 称,Llama 4 Maverick 在推理与编码能力方面表现突出,优于同类竞品。亚马逊特别强调了 MoE 架构在降低计算成本方面的价值:

 

得益于 Meta 首次采用更为高效的混合专家架构,该技术仅激活模型中与任务最相关的部分,客户能以更高计算效率进行模型训练和推理,在提升性能的同时降低成本。"

 

虽然 Llama 4 Scout 理论上支持 1000 万 token 的上下文窗口,但当前亚马逊 Bedrock 的限制为 350 万 token(官方表示将很快扩展);Llama 4 Maverick 则最高支持 100 万 token。相较于 Llama 3 系列 12.8 万 token 的上下文长度,两款模型均有显著提升。

 

在亚马逊 SageMaker JumpStart 平台,用户可根据需求通过 SageMaker Studio 或亚马逊 SageMaker Python SDK 调用新模型。两款模型默认使用配备英伟达 H100 Tensor Core GPU 的 ml.p5.48xlarge 实例,也可选择搭载英伟达 H200 Tensor Core GPU 的 ml.p5en.48xlarge 实例。Llama 4 Scout 还支持采用英伟达 L40S Tensor Core GPU 的 ml.g6e.48xlarge 实例类型。

 

在 AWS 之外,Llama 4 系列模型现已在 Databricks、GroqCloud、Lambda.ai、Cerebras Inference Cloud 等云平台上线,也可在 Hugging Face 平台使用

 

除 Scout 和 Maverick 外,Llama 4 家族还有第三款模型 Behemoth,该模型的 2880 亿活跃参数分布在 16 个专家网络中。Meta 表示当前还处于预览阶段的 Behemoth 是“最具智能的蒸馏教师模型”,Scout 与 Maverick 均是由其训练而来。

2025-05-21 14:003

评论

发布
暂无评论

Redis基础—了解Redis是如何做数据持久化的

数据库 redis 编程 计算机

简要分析近几年商业软件开发平台的现状

Philips

敏捷开发 快速开发 企业应用

TCP性能分析与调优策略

程序员 计算机网络 网络协议

马士兵老师首推Java七条自学路线,自学到底能不能行?自学也能拿到40W年薪?

Java架构追梦

Java 架构 面试 马士兵 项目实战

Pulsar Summit Asia 2020 中文专场议题出炉!

Apache Pulsar

大数据 开源 Apache Pulsar

云计算简史(完整版)

明道云

可以解除程序员中年危机的职业规划

Java架构师迁哥

「Java并发编程」从源码分析几道必问线程池的面试题?

Java架构师迁哥

anyRTC Flutter SDK :全面实现跨平台音视频互动

anyRTC开发者

音视频 WebRTC RTC sdk 安卓

阿里云视频云实时字幕技术,助力英雄联盟S10全球总决赛

阿里云CloudImagine

游戏开发 直播 语音识别 字幕

涨薪神作!华为内部操作系统与网络协议笔记爆火,Java程序员有福了

Java架构之路

Java 程序员 面试 编程语言

完美!阿里P8都赞不绝口的世界独一份489页SQL优化笔记

Java~~~

Java 数据库 程序员 架构师 SQL优化

当代开发者的六大真实现状,你被哪一个场景“戳中”了?

华为云开发者联盟

开发者 调研 报告

JVM真香系列:轻松掌握JVM运行时数据区

田维常

JVM

Java程序员必备,Github上星标55.9k的微服务神级笔记简直太香了,学完感觉自己又行了!

Java架构之路

Java 程序员 架构 面试 编程语言

5G为数字化转型插上翅膀

CECBC

5G网络安全

《迅雷链精品课》第二课:区块链核心技术框架

迅雷链

区块链

Docker

把最新JAVA面试真题(阿里/字节跳动/美团)整理出来,却被自己菜哭了,赶紧去刷题了

Java架构追梦

Java 阿里巴巴 架构 面试

IPFS云算力挖矿系统开发技术

薇電13242772558

区块链 IPFS

非线性声学回声如何破解?华为云硬核技术为你解决

华为云开发者联盟

算法 音视频

LeetCode题解:剑指 Offer 22. 链表中倒数第k个节点,使用数组,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

数字人民币都来了 黄金还有什么用?

CECBC

数字货币

Java垃圾回收GC概览

Java JVM GC

京东技术中台Flutter实践之路(二)

京东科技开发者

开源 中台 大前端 Web UI

【算法题目解析】杨氏矩阵数字查找

程序员架构进阶

算法 二分查找 杨氏矩阵

区块链产业,怎样“链”住未来?

CECBC

区块链

从一场“众盟科技云滇之播”,我们发现了美食直播的商业与公益价值

人称T客

【T1543.003】利用 ACL 隐藏恶意 Windows 服务

比伯

Java 大数据 编程 架构 计算机

cglib入门后篇

Rayjun

Java cglib

从零到千万用户,我是如何一步步优化MySQL数据库的?

冰河

数据库 架构 性能优化 分布式数据库 分布式存储

Llama 4 Scout与Maverick现已在Amazon Bedrock和SageMaker JumpStart上线_架构_Sergio De Simone_InfoQ精选文章