免费注册!6月19-20日,「亚马逊云科技中国峰会」重磅来袭! 了解详情
写点什么

Agent 框架热潮褪去,大模型开发已经进入“生死局”?

  • 2025-05-28
    北京
  • 本文字数:5530 字

    阅读完需:约 18 分钟

大小:2.70M时长:15:42
Agent 框架热潮褪去,大模型开发已经进入“生死局”?

从 2022 年起,“AI 一天,人间一年”就成了行业内的普遍共识。


AI 技术迭代速度之快,让从业者既兴奋又焦虑。一方面,大模型能力正不断进化,疯狂刷新人们的认知边界。从最初的文本生成到多模态交互,从对话式 AI 到具身智能,无一不令人兴奋。另一方面,回看这些年涌现的 AI 项目,一个个迅速地崛起、消亡,其中甚至不乏 AI 独角兽项目跌落神坛,真正能够屹立在山巅的佼佼者寥寥无几。


也正因如此,蚂蚁开源最新发布的《2025 ⼤模型开源开发⽣态全景与趋势》报告才显得格外有意义。这份报告既涵盖了智能体应⽤层和模型基础设施层,⼀共 19 个技术领域的 135 个项⽬,又对大模型开发生态的七个趋势做了深度解读。


与其说这是一份关乎大模型开发生态的报告,不如说是给所有 AI 从业者的生存指南——在竞争白热化的大模型开发“生死局”中,谁能提前洞察趋势,谁就能抢占先机。


华东师范大学教授、木兰开源社区 TOC 王伟在看过报告后甚至感慨道:当我看到这份报告的时候,大为震撼。在 AI 大模型飞速演进的今天,个体与组织常因缺乏系统性视角陷入“落后陷阱”。蚂蚁开源技术增长团队以开发者社区数据为镜,精准捕捉生态动态:从新兴趋势到战略投资机会,将代码行为转化为可量化的技术罗盘。这种全景式数据报告不仅揭示了生态位的博弈逻辑,更为企业架构升级提供了清晰的路径。 正如《合作的进化》所示:高频互动催生深度协作,而 AI 生态真正的赢家,是那些以协作定义规则、持续构建生态位的长期价值创造者。

蚂蚁开源发布大模型开源开发生态全景图


5 月 27 日,蚂蚁开源在第⼗届技术⽇上,重磅发布了《2025 ⼤模型开源开发⽣态全景与趋势》报告(以下简称“报告”),其中,生态全景图收录了包括智能体应⽤层和模型基础设施层的 135 个项目。


地址:https://antoss-landscape.my.canva.site


在生态全景图中,应用层位于最上方,展示了基于开源大模型所开发的各类应用以及相关工具。主要包括能处理复杂任务的通用助手,如 OpenManus、OWL 等;能辅助开发的编码助手,如 OpenHands、aider 等;能帮助开发者构建 Agent 的开发框架,如 Dify、n8n 等;能为用户提供与大模型交互界面的客户端界面,如 Open WebUI、SillyTavern 等;帮助开发者对应用进行开发和部署的工具,如 ComfyUI、Vercel 等;以及用于管理和优化大语言模型的 API 调用,如 LiteLLM、Model Context Protocol 等。


位于生态全景图下方的基础设施层,涵盖了数据转换、模型训练、开发、部署以及数据治理等多个方面的项目。包括数据标注、数据整合、数据治理层面,如 Label Studio、Airflow 等;在服务与训练层,包括提供大模型服务部署的 Ollam、深度学习框架 PyTorch、TensorFlow 等;以及 Ray、Spark 等分布式处理框架;CUTLASS、FlashAttention 等硬件加速库。


可以说,当下 AI 领域叫得出名号的项目,都在这份生态全景图里。


为了绘制这份全景图,蚂蚁开源团队先将时下 AI 领域中的热门项目,如 PyTorch、LangChain、vLLM 等作为种子节点,通过分析开发者在 GitHub 上不同项目之间产生的协作关联关系,不断探查生态的多个侧面。在得到初始的项目列表后,团队与相关领域的开发者们深入探讨,手动维护项目所属的技术领域标签,并不断对列表进行收敛和更新。


此外,蚂蚁开源团队还引入了华东师范大学 X-lab 实验室的 OpenRank 影响力评价指标,并以该指标在 2025 年的月均值大于 10 作为项目入选全景图的重要依据。最终呈现出了这张内容极其丰富的生态全景图。

大模型开发生态是一场真实世界的黑客松


这张⽣态全景图不仅是从业者可以拿来参考的技术地图,更揭开了行业真相:当下的大模型开发生态,是一场真实世界的黑客松。


在这场黑客松中,一切都按下了加速键——开发者们借助 AI 的强大力量,以“超级个体”的姿态,在热点事件的风口浪尖上迅速构建开源项目。我们得以看到一波又一波的 AI 开源项目,迅速地崛起。但在硬币的另一面,同样有无数项目迅速走向消亡,其中甚至不乏 AI 明星项目。这种快速构建、快速消亡,极度注重开发速度的迭代模式,与“几十个小时完成一款软件”的黑客马拉松如出一辙。


在观察生态全景图中的开源项⽬时,蚂蚁开源团队有一些有趣的发现,比如前文提到的无数项目走向消亡,这些昙花一现的项目被收录进 Dang AI 打造的“AI 墓园”中。在 Dang AI 收录的 5079 个 AI 应用工具中,有 1232 个已经停止维护。


在开源生态中,同样不乏昙花一现的项目。



比如曾获得过 3.1w 个 Star 的 AI 聊天应用 Chatbot UI,从 2023 年 3 月创建,到 2024 年 8 月消亡,也不过一年半的光景。还有曾获得过 2.1w 个 Star、堪称是最早对 AGI 进行想象的项目之一的 BabyAGI,即便早在 2023 年 4 月就前瞻性提出了“自我进化 Agent”的设想,最终还是在一年半后消失在茫茫数字世界中。甚至连 OpenAI,也有项目出现在这份“死亡名单”中——提出了“群体智能”的概念 Swarm,曾在发布时获得了极高的关注度,但最终被产业可落地的 OpenAI Agents SDK 所替代,逐渐淡出公众视野。


从某种程度上来说,AI“墓园”的存在,既反映了大模型开发生态的残酷性,也见证了从业者们无畏探索的勇气。 比如 BabyAGI、Swarm 在发布时就声称是 “实验性”、“探索性” 的尝试,但也正是这些项目所提出的先锋概念、激发的讨论和创新性尝试,为后续的项目发展提供了灵感和方向,进而促使更多开发者投身到 AI 创新的浪潮中,让大模型开发生态充满无限可能,并从概念验证向工程落地不断演进。


在这场黑客松中,无数个 AI 项目来来走走,推动大模型开发生态不断走向成熟。与此同时,随着基础模型能力不断提升,整个开发生态也在发生巨变。


报告指出,模型能力正对应用场景带来冲击与重塑:一方面,AI Search 开源项目正逐渐式微;另一方面,AI Coding 开源项目正势头火热。这种此消彼长的态势,也反映出了 AI 领域技术发展与市场需求之间的动态变化。


作为最早落地的应用场景,AI 搜索曾被视为 AI 时代的“超级应用”,但随着大模型能力的泛化,那些专注于 AI 搜索的项目优势不再明显,甚至在处理一些复杂任务时,远没有能进行推理和归纳的大模型游刃有余。更重要的是,用户其实并不在意打开的是搜索页还是对话框,可以联网的模型完全可以满足用户“先问 AI”的需求。


与之形成鲜明对比的是,AI Coding 开源项目正呈现出火热的态势,甚至在今年一度刮起了“氛围编程”(Vibe Coding)热潮。一直以来,编程都称得上是 AI 赛道的热门场景,从最早的低代码、无代码,到后期的辅助编程,甚至是 AI 自主编程,AI 的编程能力愈演愈强,也让这一赛道持续火热。报告中提到,现阶段,除了商业化产品 Cursor、Windsurf 等验证了市场热情外,以 Continue、Cline 为代表的 IDE 插件形态的项目们也是主流的开源选择。


AI Search 和 AI Coding 开源项目呈现出的不同发展态势,也在警醒从业者低头做事的同时,更要抬头看路。就像当年杀死传统胶卷相机厂商柯达的,不是同行富士、佳能,而是数码技术。从业者如果没能及时关注技术变革,难以吃到技术带来的红利,甚至会面临被市场淘汰的命运。

三大主导技术领域,发生了哪些变化?


除了上述趋势性的变化,报告也结合生态全景图中的项目排名分布,对比 2024 和 2025 年 OpenRank 的同比绝对值变化,总结出三大主导的技术领域,模型训练框架、高效推理引擎和低代码应用开发框架发生的变化:


  • 在训练上:PyTorch 是当之无愧的生态顶流,在全景图中的所有项目中影响力位列第一。而国产的深度学习平台百度飞桨,对比去年同期 OpenRank 降低了 41%,绝对值降低 150;

  • 在推理上: 高效推理引擎 vLLM 和 SGlang 在过去一年都处于飞速迭代之中,分别位于 OpenRank 同比增长的第一和第三位,他们以优越的 GPU 推理性能优势在企业级 LLM 部署中广受拥趸;

  • 在应用侧:结合低代码工具链和 RAG 知识检索管理技术的 Dify 和 RAGFlow,由于契合企业快速构建 AI 应用的需求,正在迎接属于他们的高速增长,而这两个应用开发平台都是从中国开发者社区中生长出来的强势项目。


具体来看,在训练层面,随着深度学习浪潮的兴起,PyTorch 早已形成了庞大的生态系统,成为多数模型的首选训练工具。同时,模型训练框架也在从单一硬件向混合异构计算进化,训练效率得以进一步提升,并降低了对单一硬件资源的依赖,模型训练更加灵活、高效。


在推理层面,高效推理引擎 vLLM 和 SGlang 的飞速发展,也反映出了市场对于高性能推理解决方案的迫切需求。在 AI 技术从概念走向产业落地的关键期,效率和成本成了企业关注的重点。通过优化算法和架构,推理引擎能充分发挥 GPU 的并行计算能力,提高模型推理的速度和资源利用率。


而在应用层面,过去开发 AI 应用往往需要组建一支专门的技术团队,随着 Dify 这类低代码工具链和 RAGFlow 这类 RAG 知识检索管理技术的兴起,AI 应用开发门槛大幅降低,企业得以高效构建 AI 应用,并迅速投入市场进行验证。


三大技术领域的变化,不仅反映了 AI 技术的演进方向,也揭示了市场对高性能、高效率、易用性、低成本的迫切需求。这些变化也并非孤立的技术迭代,而是整个大模型生态技术体系的系统性进化。

2025 年,有哪些大模型生态技术趋势值得关注?


这几年,整个大模型生态技术体系都在重构。在技术之外,应用场景和生态发展也在发生巨变。


应用场景层面,随着底座模型能力从早期单一的文生文,到文生图、文生视频,甚至是 any to any,早已具备了处理复杂场景问题的能力。应用场景也从基础的内容创作、文本处理,拓展到视频制作、医疗分析、教学辅导,甚至是与硬件的智能交互。


应用场景的深化,也推动整个大模型生态发展步入快车道。早在 2023 年,AI 就已经超越云原生,成为影响力最大的技术领域。随着 AI 技术加速在千行百业落地应用,大模型生态发展也进入狂飙期,尤其是开源生态的繁荣,进一步促进了大模型技术的应用创业与商业化进程。基于开源大模型衍生出的各类版本,已经被广泛应用在各个领域中。


报告选取了大模型开源开发生态当下热门的七大趋势,基于社区数据进行了趋势分析、行业观察,做出以下七大趋势论断:



2025 年被行业视为“Agent 元年”,但 Agent 框架正步入理性发展阶段。报告指出,过去两年,以 LangChain 为代表的“全能型”框架,凭借其开创性的任务编排能力和丰富的工具集成,一度主导市场。但从 2024 年下半年开始,Agent 框架热潮逐渐褪去;进入 2025 年,格局甚至呈现出分化的趋势:Dify、RAGFlow 等平台通过低代码工作流和企业级服务的落地开始主导市场;而以 LangChain 和 LlamaIndex 为代表的开发框架日渐式微。


从行业角度来看,这一变化也反映出,AI 应用开发框架的竞争焦点,已经从单纯的技术创新转向对企业实际业务场景的深度适配。报告指出,AI 应用开发者们并不缺乏新的选择,易用性、快速构建或许是当下应用开发框架的关键标签。 比如,以 LangChain 和 LlamaIndex 为代表的开发框架,在过去饱受学习成本高昂、过度复杂等诟病,而 Dify、RAGFlow 等平台通过低代码工作流,大幅降低技术门槛,迅速主导市场。


Agent 框架的市场变化,也是整个 AI 行业发展的必然结果——AI 正从各个维度降低技术门槛,无论是开发部署,还是业务融合,AI 已经从孤立的技术模块,进化成整个体系流程中的重要节点。从框架到开发工具,AI 掀起的技术普惠浪潮,让“人人都是程序员”成为可能,这也印证了报告提出的第三大技术趋势:口嫌体直的 Vibe Coding 新范式。


前文中提到,今年以来,全球范围内刮起了一股氛围编程热潮,其甚至成为当代的软件开发新范式。在调研了无数火热的 AI 开发类闭源产品,并观察了多个流行的开源项目之后,蚂蚁开源团队发现:

大厂在 AI Coding 领域快速下场,但几乎以闭源为主。 大厂的天然优势是有可以快速迭代的内部落地场景,短板则来自于对内部数据的过度依赖而导致的泛化能力不足,以及复杂的内部流程可能会阻碍创新速度。由此可见,大厂做辅助编程类工具,乃至做 AI 开发工具,有优势也有掣肘。反而是一些创业公司或三五人的小团队,能够快速产出一个该领域的开源项目,迅速出圈。


根据项目的智能化程度以及目标受众群体的专业化程度,报告将这些 GitHub 上热门的 AI Coding 类开源项目划分为四个象限,得出最终结论:AI Coding 正在尝试从一次性代码生成走向真实的软件工程场景下的开发,但依然面临很大挑战。



在技术层面,AI 在理解复杂业务逻辑时存在一定短板。在代码质量、安全性、合规性上,均面临不小的挑战。对于一些关键业务是否交给 AI,不少企业仍心存顾虑。此外,目前公开的代码数据集存在质量参差不齐等问题,这也给模型优化带来挑战。


报告指出,预计未来 24 个月内,随着代码验证技术(如形式化方法与符号执行的结合)、多模态训练数据(代码 + 文档 + 运行时日志)的成熟,以及开发者反馈闭环的优化,AI 开发助手将会承担更多常规开发任务,但仍需人类开发者在关键决策点进行监督。


而在未来,AI Agent 框架的发展也将呈现“马太效应”:功能完善、生态健全的平台将吸引更多企业用户,而这些用户的反馈和需求又将进一步推动平台优化,形成正向循环。此外,未来大模型应用会逐步向微服务化演进,即具有特定功能的 Agent/MCP 将成为互联网上独立发布并可被随时调用的服务,或者是以标准配置的形式发布以方便开发者或用户随时本地构建和启动服务。


据悉,这份报告来自于蚂蚁开源技术增长团队——该团队是蚂蚁的一个技术架构性团队,其中一大工作目标就是 “利用对开源社区的洞察来为蚂蚁的架构和技术的演进提供指引”。其实早在去年 10 ⽉,蚂蚁开源技术增长团队就曾发布过一份《从社区数据看⼤模型开发⽣态的全景与趋势》的报告。最新发布的报告,在前版内容的基础上更加丰富,无论是身处 AI 领域中的从业者,还是在其他领域深耕、对 AI 感兴趣的围观者,都具有一定的参考借鉴价值。

2025-05-28 14:3710

评论

发布
暂无评论
发现更多内容

【3.17-3.24】写作社区优秀技术博文一览

InfoQ写作社区官方

热门活动 优质创作周报

浅谈 Java线程状态转换及控制

Java你猿哥

Java 后端 多线程 ssm Java工程师

视频回放编辑工具:Mitti 激活版

真大的脸盆

Mac 视频处理 Mac 软件 视频编辑 视频回放工具

江苏银行与易观千帆达成合作,打造金融服务“新样本”

易观分析

金融 银行 经济

火山引擎基于 Dragonfly 加速实践

SOFAStack

开源 开发者 开发

来啦!OceanBase DevCon • 2023议程公布!

OceanBase 数据库

数据库 oceanbase

硬核!最全“Java面试宝典+Java核心知识集”,一箭双雕杠春招

Java java面试 Java八股文 Java面试题 Java面试八股文

MobPush Android 厂商通道回执配置指南

MobTech袤博科技

活动回顾|龙蜥社区云原生 SIG 首届 MeetUp 圆满落幕 持续打造面向云时代的竞争力

OpenAnolis小助手

开源 云原生 Meetup 龙蜥社区 sig

linux环境arm64架构编译iotDB

小黄鱼

Thrift IoTDB arm64

2023年中国品牌全域智能营销白皮书

易观分析

营销 品牌

JVM超神之路:金三银四跳槽需要的JVM知识点,都给你整理好了

Java你猿哥

Java 面试 JVM 面经 Java工程师

面试官:给你一段SQL,你会如何优化?

Java MySQL 数据库 sql 性能优化

阿里面试:100个高频Spring面试题,助你一臂之力

Java你猿哥

Java spring 面试 Spring Boot 面经

面试官:kafka分布式消息系统,你真的了解吗?

Java kafka 消息队列 消息系统 消息中间件

什么是 LuaJIT?为什么 Apache APISIX 选择了 LuaJIT?

API7.ai 技术团队

lua api 网关 APISIX API Gateway

OpenAI 发布ChatGPT 插件支持,官方文档译文

B Impact

面试官:说说什么是单点登录?什么是SSO?什么是CAS?

Java你猿哥

Java ssm CAS SSO

真香!180页100+题15W+字解析的《Java高级面试指南》,果断收下

Java java面试 Java八股文 Java面试题 Java面试八股文

MQTT安全专题01|构建可靠的物联网系统

EMQ映云科技

物联网 IoT mqtt 物联网安全 企业号 3 月 PK 榜

来2023全球边缘计算大会与EMQ探讨云边协同落地实践

EMQ映云科技

物联网 IoT 边缘计算 emq 企业号 3 月 PK 榜

操作系统跻身国家战略,中国操作系统开源社区走向何方?

OpenCloudOS

Linux 操作系统 DPU 大禹智芯 opencloudOS

QPSK/DQPSK 调制解调系统仿真

timerring

通信系统仿真

周杰伦在唱什么?数据可视化告诉你!

博文视点Broadview

这5个有趣、强大的AIGC,你值得拥有

没有用户名丶

大模型时代的异构计算平台

百度Geek说

人工智能 深度学习 AI 企业号 3 月 PK 榜

Agent 框架热潮褪去,大模型开发已经进入“生死局”?_AI&大模型_凌敏_InfoQ精选文章