Llama 4 Scout与Maverick现已在Amazon Bedrock和SageMaker JumpStart上线_架构_Sergio De Simone_InfoQ精选文章



 写点什么

登录/注册



大小：383.32K时长：02:10

Llama 4 Scout与Maverick现已在Amazon Bedrock和SageMaker JumpStart上线

AWS 近日宣布，Meta 的最新基础模型 Llama 4 Scout 与 Llama 4 Maverick 已在 Amazon Bedrock 和 AWS SageMaker JumpStart 上线。两款模型均具备多模态能力，并采用混合专家（MoE）架构。

Meta 于去年四月发布的这两款模型分别包含 170 亿个活跃参数，分布在 16 个（Scout）和 128 个（Maverick）专家网络中。其中 Llama 4 Scout 针对单块英伟达 H100 GPU 通用任务进行了优化；而据 Meta 称，Llama 4 Maverick 在推理与编码能力方面表现突出，优于同类竞品。亚马逊特别强调了 MoE 架构在降低计算成本方面的价值：

得益于 Meta 首次采用更为高效的混合专家架构，该技术仅激活模型中与任务最相关的部分，客户能以更高计算效率进行模型训练和推理，在提升性能的同时降低成本。"

虽然 Llama 4 Scout 理论上支持 1000 万 token 的上下文窗口，但当前亚马逊 Bedrock 的限制为 350 万 token（官方表示将很快扩展）；Llama 4 Maverick 则最高支持 100 万 token。相较于 Llama 3 系列 12.8 万 token 的上下文长度，两款模型均有显著提升。

在亚马逊 SageMaker JumpStart 平台，用户可根据需求通过 SageMaker Studio 或亚马逊 SageMaker Python SDK 调用新模型。两款模型默认使用配备英伟达 H100 Tensor Core GPU 的 ml.p5.48xlarge 实例，也可选择搭载英伟达 H200 Tensor Core GPU 的 ml.p5en.48xlarge 实例。Llama 4 Scout 还支持采用英伟达 L40S Tensor Core GPU 的 ml.g6e.48xlarge 实例类型。

在 AWS 之外，Llama 4 系列模型现已在 Databricks、GroqCloud、Lambda.ai、Cerebras Inference Cloud 等云平台上线，也可在 Hugging Face 平台使用。

除 Scout 和 Maverick 外，Llama 4 家族还有第三款模型 Behemoth，该模型的 2880 亿活跃参数分布在 16 个专家网络中。Meta 表示当前还处于预览阶段的 Behemoth 是“最具智能的蒸馏教师模型”，Scout 与 Maverick 均是由其训练而来。

评论

发布

暂无评论

Java IO，Java真实项目案例分享

Java 程序员后端

HashMap详解，hadoop源码分析完整版

Java 程序员后端

hive学习笔记之三：内部表和外部表，java面试手写算法

Java 程序员后端

IDEA 一键部署 SpringBoot 项目到远程服务器 Docker 内(1)

Java 程序员后端

Jaeger知识点补充，mysqlsql优化视频教程百度网盘

Java 程序员后端

Java BSON使用，springboot运行原理理解

Java 程序员后端

Java SSM (springboot+mybatis)美食菜谱分享平台系统设计和实现以及论文报告

Java 程序员后端

Hello Git快速入门，redis常见数据结构以及使用场景分析

Java 程序员后端

IDEA 一键部署 SpringBoot 项目到远程服务器 Docker 内

Java 程序员后端

Java 世界里的垃圾回收规则你搞懂了吗？，java编程思想百度云

Java 程序员后端

HTTP-2做错了什么？刚刚辉煌2年就要被弃用了！，mybatis底层工作原理

Java 程序员后端

IDEA-2021首个大版本发布，Java开发者感动哭了（附新亮点演示

Java 程序员后端

jackson学习之九：springboot整合(配置文件)，jpa和mybatis的区别面试

Java 程序员后端

Java 多线程 —— 同步代码块，给大家安排上

Java 程序员后端

hive学习笔记之八：Sqoop，大厂Offer拿到手软啊

Java 程序员后端

HTML笔记 —— 列表，和快手大佬的技术面谈

Java 程序员后端

IDEA这样配置，好用到爆炸！，金九银十怎么从中小企业挤进一线大厂

Java 程序员后端

Java 新特性之泛型，kafka的架构图

Java 程序员后端

hive学习笔记之三：内部表和外部表(1)，贼好用的Java学习路线集合

Java 程序员后端

Java 必须掌握的 12 种 Spring 常用注解！你掌握了几种？

Java 程序员后端

Java 的大 Class 到底是什么？，吃透这份Java高级工程师面试497题解析

Java 程序员后端

1个月连载30个设计模式真实案例（附源码），挑战年薪60W不是梦

Java 架构设计模式

HashMap（jdk1，Java程序员进大厂面试必备基础技能

Java 程序员后端

Helm部署的服务如何修改配置，nginx面试题负载均衡

Java 程序员后端

hive学习笔记之七：内置函数，mybatis防止sql注入原理

Java 程序员后端

Java lambda表达式用法介绍，linux教程第四版思考题答案

Java 程序员后端

Java this关键字详解（3种用法），springaop实现原理面试题

Java 程序员后端

hive学习笔记之九：基础UDF，java入门书籍下载

Java 程序员后端

IDEA这样配置，好用到爆炸！(1)，java基础入门第二版课后答案

Java 程序员后端

Intellij IDEA神器那些让人爱不释手的小技巧，java高级程序员面试笔试

Java 程序员后端

jackson学习之八：常用方法注解，为什么阿里的程序员成长如此之快

Java 程序员后端