
亚马逊云科技最近宣布增强其 Lambda 的响应流(response streaming)能力,将默认最大响应 payload 大小从 20 MB 提升至 200 MB。这意味着开发者现在可以直接从无服务器函数流式传输更大、更高数据量的响应内容,而无需额外处理或中转。
所谓“响应流”是一种调用模式,允许 Lambda 函数在生成内容的同时,就把部分结果发送回客户端,而不是等所有内容都准备完毕后才统一返回。这对提升“首字节时间”(Time to First Byte, TTFB)特别有帮助,因为客户端可以立即开始渲染或处理数据。
在此之前,只要响应超过 20 MB,开发者往往不得不采取一些复杂的变通办法,例如对 payload 进行压缩、分片,或者借助 S3 等中介服务来绕过限制。
自由顾问 Tobias Smidt 在 LinkedIn 上写道:
以前,如果你需要发送超过 20 MB 的内容,就得压缩、分块,或通过预签名 URL 将其 offload 到 S3。这意味着更多环节、更高延迟(还有更多代码要维护!可能是之前最糟糕的取舍)。现在你能直接从 Lambda 流式传输高达 200 MB 的内容了。无需每次都交给 S3 中转。

亚马逊云科技在公告中提到,新 200 MB 限制让开发者可以直接在 Lambda 内处理并流式传输大规模数据集、图像密集型 PDF 文件,甚至音乐文件。
计算机科学与工程(CSE)·人工智能工程师 Jin Tan Ruan 在 LinkedIn 上说:
对于生成式 AI 及其他数据密集型工作负载而言,这是个颠覆性变化。200 MB 是相当可观的量——大约相当于 ~200,000 页文本或数十张高分辨率图像。一次性处理如此大小的 payload,使 Lambda 能够将丰富的 AI 生成内容直接返回给用户。
但有人在 Reddit 上问:
那 API Gateway 怎么办?
另一位网友回复:
很遗憾目前还不支持 —— 目前仅支持 Lambda function URL。
此外,首席云架构师 Ivo Pinto 在另一条 LinkedIn 帖文中指出:
20 MB → 200 MB 解锁了哪些可能:
- 文本:约 5M → 50M 字符(约 20K → 200K 典型 LLM tokens)
- 带图像 PDF:约 200 → 2,000 页
- 图像:约 20 → 200 张高分辨率处理结果
- 音频:约 3 → 30 分钟的处理/增强音频文件
这基本上免去了为超过 20 MB 的输出专门设计复杂分块逻辑的负担。不过要注意,Lambda 的执行时间上限仍然是 15 分钟。
Lambda 响应流功能支持 Node.js 托管运行时和自定义运行时。此外,新 200 MB 的响应流 payload 限制已在 Lambda 响应流支持的所有亚马逊云科技区域中作为默认值生效。
原文链接:
https://www.infoq.com/news/2025/08/lambda-stream-200mb-payload/
评论