50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

AWS Lambda 响应流能力提升,默认最大 Payload 限制增至 200 MB

  • 2025-08-29
    北京
  • 本文字数:1004 字

    阅读完需:约 3 分钟

大小:483.72K时长:02:45
AWS Lambda 响应流能力提升,默认最大 Payload 限制增至 200 MB

亚马逊云科技最近宣布增强其 Lambda 的响应流(response streaming)能力,将默认最大响应 payload 大小从 20 MB 提升至 200 MB。这意味着开发者现在可以直接从无服务器函数流式传输更大、更高数据量的响应内容,而无需额外处理或中转。


所谓“响应流”是一种调用模式,允许 Lambda 函数在生成内容的同时,就把部分结果发送回客户端,而不是等所有内容都准备完毕后才统一返回。这对提升“首字节时间”(Time to First Byte, TTFB)特别有帮助,因为客户端可以立即开始渲染或处理数据。


在此之前,只要响应超过 20 MB,开发者往往不得不采取一些复杂的变通办法,例如对 payload 进行压缩、分片,或者借助 S3 等中介服务来绕过限制。


自由顾问 Tobias Smidt 在 LinkedIn 上写道:


以前,如果你需要发送超过 20 MB 的内容,就得压缩、分块,或通过预签名 URL 将其 offload 到 S3。这意味着更多环节、更高延迟(还有更多代码要维护!可能是之前最糟糕的取舍)。现在你能直接从 Lambda 流式传输高达 200 MB 的内容了。无需每次都交给 S3 中转。



亚马逊云科技在公告中提到,新 200 MB 限制让开发者可以直接在 Lambda 内处理并流式传输大规模数据集、图像密集型 PDF 文件,甚至音乐文件。


计算机科学与工程(CSE)·人工智能工程师 Jin Tan Ruan 在 LinkedIn 上说


对于生成式 AI 及其他数据密集型工作负载而言,这是个颠覆性变化。200 MB 是相当可观的量——大约相当于 ~200,000 页文本或数十张高分辨率图像。一次性处理如此大小的 payload,使 Lambda 能够将丰富的 AI 生成内容直接返回给用户。


但有人在 Reddit 上问:


那 API Gateway 怎么办?


另一位网友回复:


很遗憾目前还不支持 —— 目前仅支持 Lambda function URL。


此外,首席云架构师 Ivo Pinto 在另一条 LinkedIn 帖文中指出:


20 MB → 200 MB 解锁了哪些可能:

- 文本:约 5M → 50M 字符(约 20K → 200K 典型 LLM tokens)

- 带图像 PDF:约 200 → 2,000 页

- 图像:约 20 → 200 张高分辨率处理结果

- 音频:约 3 → 30 分钟的处理/增强音频文件


这基本上免去了为超过 20 MB 的输出专门设计复杂分块逻辑的负担。不过要注意,Lambda 的执行时间上限仍然是 15 分钟。


Lambda 响应流功能支持 Node.js 托管运行时和自定义运行时。此外,新 200 MB 的响应流 payload 限制已在 Lambda 响应流支持的所有亚马逊云科技区域中作为默认值生效。


原文链接:

https://www.infoq.com/news/2025/08/lambda-stream-200mb-payload/

2025-08-29 15:007152

评论

发布
暂无评论

全球首个开发者村“开村”!数字之光在何处点亮?

白洞计划

第四范式开源强化学习研究通用框架,支持单智能体、多智能体训练,还可训练自然语言任务!训练速度提升17%

Geek_32eb82

太强了!阿里人用138个案例讲明白了Spring全家桶+Docker+MQ

Java spring 微服务 Spring Cloud Spring Boot

硬核!阿里自爆虐心万字面试手册,Github上获赞89.7K

Java 程序员

小红书如何应对万亿级社交网络关系挑战?图存储系统 REDtao 来了!

小红书技术REDtech

云原生 存储 图数据库 跨云多活

叹服!阿里自述SpringCloud微服务:入门+实战+案例

Java 架构 微服务 Spring Cloud

八股MQ001——为什么需要使用MQ?

Codyida

后端

八股MQ002——说说Rebalance?

Codyida

后端

简洁好用的思维导图软件:simplemind 中文版

真大的脸盆

Mac 思维导图 Mac 软件 思维导图软件

面试官:如何保证 RabbitMQ 的消息可靠性

Java 面试 RabbitMQ 消息队列 消息中间件

SpringBoot自动配置原理详解

Java Spring Boot

即时通讯技术文集(第14期):WebSocket精华文章合集 [共15篇]

JackJiang

网络编程 即时通讯 IM

病假单|病假条|体检报告|诊断证明书|病历证明|医院化验单|ct报告|b超单|怀孕检查

病假条病假单

面试被Spring Cloud拿捏?莫慌,阿里人用五个模块讲明白了SpringCloud微服务架构

Java 架构 微服务 Spring Cloud

SpringBoot 项目解决跨域的几种方案

Java Spring Boot

八股MQ005——聊聊Broker

Codyida

后端

Netty服务端开发及性能优化 | 京东云技术团队

京东科技开发者

Netty 高性能 netty内存管理 企业号 5 月 PK 榜

分布式编译系统的搭建

GreatSQL

MySQL greatsql社区 分布式编译

版本控制 | 如何使用虚幻引擎的多用户编辑(MUE)功能

龙智—DevSecOps解决方案

版本控制 虚幻引擎 虚拟制作 虚幻多用户编辑

Spring Security 中的基本认证过滤器链

Java架构历程

Java spring security 三周年连更

升级企业数智化底座 用友iuap拉满长期主义

用友BIP

153个!PCB板上的字母符号都代表啥?一图带你搞懂!

华秋PCB

物理 电路 元器件 PCB PCB设计

使用TPC-H 进行GreatSQL并行查询测试

GreatSQL

MySQL 并行查询 greatsql greatsql社区

八股MQ004——聊聊Producer

Codyida

后端

openEuler之上的K3s ARM64集群管理

openEuler

Linux 云原生 k8s AWS Kubernetes Serverless

NFTScan 推出「nftonchain」Telegram channel,实时推送链上 NFT 热点数据

NFT Research

NFT 智能推送 #Web3

京东物流常态化压测实践 | 京东云技术团队

京东科技开发者

测试 压测 常态化压测 企业号 5 月 PK 榜

演讲回顾 | 释放Atlassian工具的力量

龙智—DevSecOps解决方案

Atlassian Jira Atlassian 云版

膜拜!阿里人用10W字面经把Java面试官拿下了

Java java面试 Java八股文 Java面试题 Java面试八股文

OceanBase 4.0(小鱼)入选2023数字中国建设峰会“十大硬核科技”!

OceanBase 数据库

数据库 oceanbase

干货满满的技术盛宴!OpenHarmony开发者大会技术分论坛成功举办

最新动态

AWS Lambda 响应流能力提升,默认最大 Payload 限制增至 200 MB_亚马逊云科技_Steef-Jan Wiggers_InfoQ精选文章