写点什么

AWS Lambda 响应流能力提升,默认最大 Payload 限制增至 200 MB

  • 2025-08-29
    北京
  • 本文字数:1004 字

    阅读完需:约 3 分钟

大小:483.72K时长:02:45
AWS Lambda 响应流能力提升,默认最大 Payload 限制增至 200 MB

亚马逊云科技最近宣布增强其 Lambda 的响应流(response streaming)能力,将默认最大响应 payload 大小从 20 MB 提升至 200 MB。这意味着开发者现在可以直接从无服务器函数流式传输更大、更高数据量的响应内容,而无需额外处理或中转。


所谓“响应流”是一种调用模式,允许 Lambda 函数在生成内容的同时,就把部分结果发送回客户端,而不是等所有内容都准备完毕后才统一返回。这对提升“首字节时间”(Time to First Byte, TTFB)特别有帮助,因为客户端可以立即开始渲染或处理数据。


在此之前,只要响应超过 20 MB,开发者往往不得不采取一些复杂的变通办法,例如对 payload 进行压缩、分片,或者借助 S3 等中介服务来绕过限制。


自由顾问 Tobias Smidt 在 LinkedIn 上写道:


以前,如果你需要发送超过 20 MB 的内容,就得压缩、分块,或通过预签名 URL 将其 offload 到 S3。这意味着更多环节、更高延迟(还有更多代码要维护!可能是之前最糟糕的取舍)。现在你能直接从 Lambda 流式传输高达 200 MB 的内容了。无需每次都交给 S3 中转。



亚马逊云科技在公告中提到,新 200 MB 限制让开发者可以直接在 Lambda 内处理并流式传输大规模数据集、图像密集型 PDF 文件,甚至音乐文件。


计算机科学与工程(CSE)·人工智能工程师 Jin Tan Ruan 在 LinkedIn 上说


对于生成式 AI 及其他数据密集型工作负载而言,这是个颠覆性变化。200 MB 是相当可观的量——大约相当于 ~200,000 页文本或数十张高分辨率图像。一次性处理如此大小的 payload,使 Lambda 能够将丰富的 AI 生成内容直接返回给用户。


但有人在 Reddit 上问:


那 API Gateway 怎么办?


另一位网友回复:


很遗憾目前还不支持 —— 目前仅支持 Lambda function URL。


此外,首席云架构师 Ivo Pinto 在另一条 LinkedIn 帖文中指出:


20 MB → 200 MB 解锁了哪些可能:

- 文本:约 5M → 50M 字符(约 20K → 200K 典型 LLM tokens)

- 带图像 PDF:约 200 → 2,000 页

- 图像:约 20 → 200 张高分辨率处理结果

- 音频:约 3 → 30 分钟的处理/增强音频文件


这基本上免去了为超过 20 MB 的输出专门设计复杂分块逻辑的负担。不过要注意,Lambda 的执行时间上限仍然是 15 分钟。


Lambda 响应流功能支持 Node.js 托管运行时和自定义运行时。此外,新 200 MB 的响应流 payload 限制已在 Lambda 响应流支持的所有亚马逊云科技区域中作为默认值生效。


原文链接:

https://www.infoq.com/news/2025/08/lambda-stream-200mb-payload/

2025-08-29 15:001

评论

发布
暂无评论

Maven中的这些坑,99%的人不知道!

不在线第一只蜗牛

Java 开发

黑龙江等保测评:2025年新规核心变化与应对策略

等保测评

亚马逊机器人如何用多模态识别技术取代条形码

qife122

机器人技术 自动化识别

YashanDB SIGN函数

YashanDB

数据库

YashanDB SINH函数

YashanDB

数据库

智慧工地实践案例:用数智应用破解土石方工程效率与成本难题

袋鼠云数栈

AI 数字化转型 云计算, 数字化解决方案 大数据计算

javax.security.auth.login.LoginException: No CallbackHandler available to garner authentication info

刘大猫

人工智能 数据挖掘 算法 数据分析 LoginException

基于深度学习的YOLO框架的道路裂缝智能识别系统【附完整源码+数据集】

程序员Geek

人工智能

AI编程神器!Trae+Claude4.0 简单配置 让HarmonyOS开发效率飙升 - 坚果派

万少

HarmonyOS NEXT

黑龙江等保测评:企业等保测评全流程指南

等保测评

火山引擎 MCP 安全架构与实践

Lily

DIFC 2025年上半年业绩助推迪拜经济愿景

财见

5000字谈普通人如何用AI扩大影响力

阿星AI工作室

AI 产品经理 AIGC 超级个体

网络嗅探工具Intercepter-NG的技术内幕与黑客文化变迁

qife122

网络安全 黑客文化

加密货币硬件钱包安全使用的10条黄金法则

qife122

区块链 加密货币安全

YashanDB SIN函数

YashanDB

数据库

机器学习赋能计算机嗅觉革命:Osmo的气味图谱突破

qife122

机器学习 数字嗅觉

Java中什么是类加载?类加载的过程?

量贩潮汐·WholesaleTide

Java

基于 Nacos + Higress 的 MCP 开发新范式,手把手教程来了!

阿里巴巴云原生

阿里云 云原生 Higress

WPS 灵犀语音助手:AI 对话处理文档;通义 Qwen3-MT:支持 92+语言互译的 AI 翻译引擎丨日报

声网

由挑战走向未来:无线网络如何迎接智能时代?

脑极体

AI

Hologres V3.1版本发布,Serverless型实例从零开始构建OLAP系统

阿里云大数据AI技术

人工智能 机器学习 大数据 数据分析 hologres

使用 Databend Cloud 归档 OceanBase 数据数据库

Databend

基于Dify构建本地化知识库智能体:从0到1的实践指南

知识浅谈

dify

巡检任务管理系统(源码+文档+讲解+演示)

深圳亥时科技

黑龙江等保测评:三级系统测评成本优化策略

等保测评

非凸科技受邀出席第九届AI&FOF投资创新发展论坛

非凸科技

智源研究院发布数据魔方,以智能化自定义方式重构模型训练数据供给范式

智源研究院

技术文章

qife122

人工智能 openai

【苍狮技术团队】速看!Linux离线安装Docker、Docker-Compose竟如此简单?

苍狮技术团队

“多模态数据融合技术创新与落地实战”活动在数新智能圆满收官,产学研共探智能时代新路径

数新网络官方账号

AWS Lambda 响应流能力提升,默认最大 Payload 限制增至 200 MB_亚马逊云科技_Steef-Jan Wiggers_InfoQ精选文章