扣子官宣开源，掀桌大动作背后如何决策？扣子负责人独家披露

7 月 26 日，字节将 AI Agent 平台「扣子（Coze）」旗下最核心的两个项目—— Coze Studio 与 Coze Loop 正式开源至 GitHub，并采用开放程度更高、可自由用于任何商业用途的 Apache 2.0 许可证，无任何附加条款。开源仅两天，项目已在 GitHub 上收获超过 6K star。

“事实上，在扣子项目启动之初以及去年年中，内部都曾讨论过开源的可能性，但当时我们认为时机尚未成熟。如今，我们认为已迎来开源的良好契机。”扣子业务负责人对 InfoQ 说道。

扣子从 2023 年海外试水起步，去年 2 月正式上线国内版。国内据非凡产研数据显示，截至 2025 年 6 月，扣子的月访问用户数达到约 458 万。拥有如此用户体量的平台选择开源，这一决策的达成并不容易。期间，团队内部通过定期审视与深度讨论，不断评估相关事项。

关于开源策略的主要争议点集中在两方面：一是开源对扣子意味着什么；二是开源后长期如何与社区协作。对于这些问题，扣子负责人坦言，“目前我们尚无法给出百分之百确切的答案。不过团队已就相关问题的应对思路形成了基本共识。”

作为在国内占据半壁江山的 AI Agent 搭建平台，扣子此次基于 Apache 2.0 许可协议开源、不设置任何商业化限制，可以说是一个掀桌的大动作。在扣子正式开源之前，InfoQ 独家对话了扣子业务负责人，首次公开扣子开源决策背后的故事，并深入探讨了开源版扣子的目标、定位以及扣子团队对于 Agent 开发未来发展的思考等问题。

扣子开源目标：成为事实标准之一

扣子开源的决定过程，本质上折射出了 Agent 迅速变化的发展趋势。

相较于去年行业对 Agent 定义及应用前景的模糊认知，如今 Agentic AI 理念已被普遍接受，并在多个领域已有原型应用。面对激烈的竞争，业界达成了更广泛的共识：未来的 Agent 生态必将由成千上万的开发者共同定义，而非由单一公司主导。

这意味着封闭平台很难满足生态爆发的需求。开源是直接获取全球一线开发者反馈、代码贡献以及宝贵创新思想的最佳路径，可以充分挖掘尚未被发现的多样化需求。

与此同时，一个真正可用的 Agent 的构建门槛仍然较高。虽然今年涌现了来自创业公司和大厂的约数十个 Agent 项目，涵盖通用型与垂直领域，但市场需求远未满足——各行各业的企业用户都期望开发定制化 Agent，来提升工作效率或实现商业转化。然而，开发壁垒阻碍了这一进程。

从扣子对用户画像的预期和现实对比，也可以看出降低门槛的现实意义。扣子的用户大致可以分为三类：熟练掌握各类开发技能的专业开发者；拥有明确需求并能理解开发逻辑、可通过编程解决问题但不擅长编码的准专业用户；对编程概念和语言一无所知的零基础用户。

扣子最初的目标用户是专业开发者和准专业用户。但实际运营数据显示，当前用户群体中专业开发者、准专业用户与零基础用户的比例接近 1：1：1。基于此，降低产品门槛必然是下一阶段的重要任务之一。

以扣子当前最核心功能之一的工作流来说，创建工作流仍存在一定门槛，现在可以自主编写工作流的人群主要还是专业程序员、产品经理与运营人员和技术爱好者。对此，扣子团队正在努力让工作流变得更加易用，具体包括：支持自然语言生成工作流、简化工作流节点设计以及让复杂难懂的概念更易于理解等。

扣子团队也观察到当前 Agent 生态热闹但同质化与碎片化问题严重的情况。“行业存在一定的浮躁，部分公司急于发布产品，却忽视了实用性，导致许多 Agent 仅停留在‘能聊几句’的演示阶段。‘做出一个 Agent’到‘做好一个 Agent’之间存在显著差距。”

扣子团队希望通过开源吸引更广泛的开发者，包括非程序员和非科技公司，快速将行业知识转化为 Agent 应用，丰富生态。同时，通过开放 LLMOps 工具引导开发者更加重视 Agent 的可靠性、稳定性和可观测性，推动领域从“能做”到“做稳、做好”，再向工业级、生产级标准迈进。

事实上，团队更是想通过开源将扣子打造成为 Agent 开发领域的基础设施和事实标准。

“当前 Agent 生态在开发范式、插件接口、能力定义等核心环节尚未形成统一标准。去年底发布的 MCP 在业内反响强烈，印证了市场对标准化能力调用的广泛需求。然而，此类标准主要解决了能力调用环节，其他诸多接口与规范仍有待定义。”扣子业务负责人表示，“我们期望经过大规模实践验证的扣子体系，能够成为社区广泛采纳的事实标准之一，这将促进不同 Agent 之间的互操作性及组件复用，有效减少行业的重复建设。”

在多轮深入讨论后，团队内部达成共识：赢得 Agent 时代的关键在于赢得开发者，而拥抱开源是赢得开发者的最佳方式。

在今年年初一次关键讨论后，团队最终决定将扣子开源，并为此组建了专门的团队，投入近半年时间进行代码重构、文档完善和社区基础设施准备，终于迈出了开源这一步。

针对开源项目十分关键的开源许可协议，团队经过多番考量后选择了 Apache 2.0，这既是对项目开放性的保障，也进一步映证了团队希望借开源将扣子打造为事实标准的野心。

作为当前最流行的商业友好型许可证之一，Apache 2.0 许可既符合 OSI（开放源代码促进会）认可的开源定义，也符合社区对开源的共识，因此最容易被全球开发者广泛理解和接受。相较于有更多限制的许可证，Apache 2.0 许可证不对下游用户（无论是个人开发者、创业公司还是大型企业）设置任何商业化限制，这意味着任何人都可以在开源扣子的基础上构建自己的应用、服务，甚至是商业化的 SaaS 产品，而不必担心许可证带来的法律风险或商业限制。

此外，Apache 2.0 许可证对社区贡献者也非常友好，有明确的专利授权和终止条款，能确保贡献者受到保护，同时避免潜在的专利争议。这也有助于增强社区开发者的信任，扣子团队希望借此吸引更多人参与贡献，鼓励社区自由修改和扩展开源版扣子的功能，最大程度地便利开发者参与，从而形成一个良性循环的开源生态。

开源版扣子：核心引擎全量开放

此次开源的是扣子最核心的两个项目：Coze Studio 与 Coze Loop。

Coze Studio 开源的核心功能包括：

完整的工作流（Workflow）引擎：这是扣子团队投入最大精力构建的核心组件。本次开源涵盖了工作流引擎所有节点及编排逻辑。开发者可直接在可视化界面上进行拖拽操作，使用现有功能或进行二次定制与开发。
插件（Plugin）核心框架：开放了插件的定义、调用和管理机制，开发者可以便捷地将任何第三方 API 或私有能力封装成插件，无限扩展 Agent 的能力边界。
开箱即用的开发环境：只需一键部署，即可获得一个功能完备的 Agent 开发平台，包括创建、调试、版本管理等全套界面，开发者可以专注于创造本身。

Coze Studio 的 GitHub 项目地址：https://github.com/coze-dev/coze-studio

此外，智能体开发面临的核心挑战还在于模型输出的不确定性及可能产生的幻觉。开发者自行测试时效果尚可的智能体，一旦面向真实用户，往往会暴露出诸多问题。这种不确定性是当前智能体落地应用的主要痛点。为此，这次扣子同步开源了 AI Agent 全生命周期调优平台 Coze Loop，专注智能体开发和调优，可以做到效果评测、线上观测和优化迭代的闭环。

Coze Loop 开源的核心功能包括：

Prompt 开发：提供从编写、调试、一键优化到版本管理的系统化能力；
多维度评测：提供系统化的评测能力，能从准确性、简洁性、合规性等多个维度，自动化地评估 Prompt 和 Agent 的输出质量；
全链路可观测性：提供覆盖全过程的可视化观测能力，详细记录每个环节的处理细节与状态，让 Debug 不再是大海捞针。

Coze Loop 的 GitHub 项目地址：https://github.com/coze-dev/coze-loop

总体来看，扣子的开源整体上是“立体化”的：同时开放了上层编排逻辑和底层框架。

不同于从开源起步的项目，扣子是在商业化产品成熟后才决定开源。这其实给开源版扣子带来了独特优势：其开源的工作流引擎、Agent 编排逻辑均经过字节内部大规模验证，可直接用于生产环境。

开源版扣子的使命

开源版扣子主要面向个人开发者、技术爱好者，以及处于技术预研和概念验证阶段的企业开发者。

在核心构建能力上，开源版扣子对企业用户没有限制，限制主要体现在一些附加的企业级功能和服务上，比如整个租户管理体系未开源、面向企业提供的弹性扩展功能也未开源。这些功能是为了满足大规模、高要求的企业场景而提供的增值服务。

对于这一决策，扣子业务负责人向 InfoQ 解释道，当企业需要大规模部署应用时，例如基于开源版本构建日活跃用户数达千万级别的应用，理论上虽然可行，但实际会面临显著的二次开发成本。这些成本主要源于企业级应用所需的支撑能力，例如租户管理体系、高并发处理能力等，这些需求超出了开源并发框架本身提供的能力范畴。

更深入来说，一方面，团队要确保开源项目对开发者足够友好、易于部署。许多企业版能力与字节跳动内部系统及其提供的云服务存在深度耦合，将这些功能包含在开源版本中，反而会降低项目的开发者友好性——用户可能需要依赖较重的外部服务资源才能使用它们。因此，团队选择将这些功能解耦，确保开源版扣子更易于开发者独立部署和运行。

另一方面，开源版扣子还承担了引导大型企业用户放心采用商业化版本的作用。

在扣子团队看来，开源版扣子通过有效展示核心价值，可以提升向功能更全面、服务更完善的企业版转化的可能性。另外，对于需要连接企业内外部数据的 Agent 应用而言，信任至关重要。“开源意味着我们将核心代码逻辑向社区公开，这是建立信任最彻底且高效的方式。开发者和企业能够充分审计代码，确保其安全可靠，这也有力地支撑了我们的商业化落地。”

据了解，开源版扣子的定位是整个扣子产品体系的基石与生态入口，团队版和企业版则是服务企业客户的商业化引擎。扣子内部对不同版本的定位如下：

开源版：面向个人开发者与技术爱好者，是产品体系的核心引擎。它提供完整的智能体开发、调试与运行环境，核心价值在于技术赋能与生态构建。
团队版：面向中小企业及开发团队。在开源版基础上，增加了云端托管、多人协作、团队资源管理等，使团队无需自行部署运维，注册后即可在云端快速开发。
企业版：面向中大型企业及对安全合规有更高要求的客户，提供最全面的功能，包括单点登录（SSO）、更严格的权限管理、审计日志、高级人性化特性等，满足企业级应用需求。

扣子业务负责人称，“团队承诺将实现‘内外同源’，即确保商业化版本与开源版本保持同步。”这意味着商业化版本与开源版本共享同一套核心代码库，所有针对核心链路的优化与改进都会实时同步至开源版本，同时团队不用再单独分配大量人力维护开源分支。

现在用户在扣子上创建智能体，支持选择是单智能体还是多智能体，这种划分的形成是用户多样任务需求和期望的产物。单智能体对话流（预设剧本式）会设定固定节点，适用于流程固定任务（如客服、查询、预订），特性是高稳定、可控，但无法处理预设外任务；单智能体自主规划模式（个人助理式）只需用户设定目标，智能体会动态规划，适用于开放式任务，如信息研究，支持复杂非预设路径，但稳定性与性能受限；多智能体协作（项目团队式）需创建分工智能体并由调度中心协同，适用于需多角色协作的复杂任务。

本次开源会涵盖上述全部模式，扣子还计划在第三季度对开发模式进行重大升级，核心目标是实现开发更简单、能力更强、运行更稳定。

如何评判扣子开源是否成功，也是早期团队讨论较多的核心议题之一。扣子业务负责人表示，扣子开源成功的标准是多元的，具体会从以下三个维度来看：

基础活跃度指标，包括但不限于开源社区（如 GitHub）的常见数据，如 Star 数、Fork 数、下载量，以及社区内的活跃用户数、讨论热度等。这些指标反映了项目的初步吸引力和基础活跃程度。
生态贡献度指标，这是衡量开源生态是否真正繁荣的关键。扣子团队观察到部分项目将开源仅视为宣传手段，而忽视生态建设，这违背了开源精神，因此扣子高度重视社区的实质贡献，具体包括：社区贡献的插件数量与质量；外部代码贡献者数量及其提交的 PR 质量。这些指标能有效反映项目的活力、技术深度及社区的协作参与程度。
行业影响力指标，这也是扣子团队的终极目标，主要考察：基于扣子（包括开源版和商业版）构建的有影响力的 AI 应用或智能体的数量；开源版扣子在企业生产环境中的实际采用率；开源对商业转化的健康促进程度等。

在扣子团队的预期中，开源能增强用户对扣子的信任，从而自然引导更多企业用户采用其功能更完善、服务更全面的商业化版本，这本身即是开源模式成功的重要验证。

“当开发者社区普遍将扣子视为构建智能体的首选平台时，我们即认为其开源取得了成功。”扣子业务负责人说道。

扣子的核心竞争力

在大模型技术发展初期，Agent 平台的核心竞争力主要取决于模型本身的性能：模型能力越强，产品体验自然越优。然而，随着模型能力的持续演进并逐渐趋同，Agent 平台的核心竞争力已转向平台的编排、集成与工程化能力，核心在于如何使大模型更稳定、高效且低成本地使用工具并连接外部世界。

扣子业务负责人表示，与市面上的其他同类产品相比，扣子能提供完整的开发、运维与分发全流程解决方案。相比之下，许多仅专注于单一环节的产品，如仅支持前端开发的低代码工具，难以支撑构建完整的带后端程序的应用，更无法满足生产环境需求。扣子支持开发者在单一平台内流畅完成从创意构思到生产上线的全部环节。

如今，扣子的目标是真正服务企业生产环境，因此在编排引擎的稳定性、高并发处理能力、精细化控制与调试等方面进行了深度打磨，具备显著优势。此外，扣子采取开放兼容的态度，不绑定特定厂商模型，广泛支持全球多样化的模型与工具，将选择权充分赋予开发者。

据介绍，上线至今，扣子架构最大的转变是从紧耦合的 SaaS 应用演进为模块化、服务化的 AI PaaS 平台。

从上线以来，扣子团队广泛吸纳了来自国内外社区的反馈，包括大量关于 API、私有化部署、定制化的问询。团队注意到，国内众多大型企业已在高频使用扣子，这让团队意识到，扣子的价值不仅限于 SaaS 产品，更具备成为 Agent 开发 PaaS 平台或 AI 开发基础设施的潜力。

早期，扣子的功能高度耦合，难以灵活扩展。随着企业客户越来越多，团队迅速意识到：过往开发者多将平台用于概念验证或构建 demo，但越来越多的用户希望将构建好的工作流直接部署到生产环境，其中不乏日活用户百万甚至千万级别的企业。

庞大的用户量对扣子的高并发处理能力构成了严峻考验。因此，去年下半年起，扣子团队在支撑企业级应用生产环境部署方面进行了重点优化，通过大规模解耦重构来确保架构各层均能满足企业生产环境要求。

当前扣子的架构已通过大规模生产验证：引擎可支撑日活数万至数千万级应用，成功服务字节内外众多客户，处理高并发与海量日均调用；宏观上遵循标准化的模型调用链路，微观层面实现深度解耦，如模型与插件解耦，支持多模型与多插件的低成本、无缝切换与动态组合，提升工程灵活性。

当前，扣子的核心架构可以分为四层：

模型层，通过统一接口和管理体系，适配市面上主流大模型，如豆包大模型、DeepSeek 等第三方模型，负责统一路由、调度与精细化管理，并集成 PagedAttention、KV Cache 等技术，优化生产环境中的模型推理成本与性能，该层的能力建设投入巨大。
能力层，提供构建智能体的核心工具集，包括插件系统、知识库、上下文管理及数据库支持，确保 Agent 具备灵活的能力扩展性。
编排层，为核心引擎，包含两大核心模块：支持工程化编排的工作流引擎和实现基于模型的自主化编排意图驱动引擎，该层是扣子的核心驱动力。
应用层，通过标准化 API 集成、提供 UI 组件库等方式，支持开发者将 Agent 无缝嵌入各类应用如飞书、微信公众号等。

避免被大模型“卷掉”的关键

尽管模型能力会持续演进，但在扣子团队看来，始终会存在模型自身难以完成的任务。实际应用仅依赖基础模型调用往往是不够的，而是需要集成多种工具，另外构建性能优异的智能体需要进行大量调试工作，这正是专业工具的价值所在。

“这些任务需要沉淀在类似扣子这样的平台上，通过平台固化的能力、流程或协作模式来解决。只是，模型能力覆盖特定任务的时间点会因技术发展阶段不同而有所差异。因此，避免被‘卷掉’的关键在于深刻理解并解决特定用户群体在特定流程中的真实痛点，构建模型难以替代的平台价值。”扣子业务负责人说道。

在其看来，智能体赛道今年才真正起步。去年行业焦点在聊天机器人，比拼的是对话内容的吸引力和契合度；而今年智能体的核心价值在于能否在用户真实工作场景中完成特定任务，并且是高效可靠地完成。

那么，如何将“勉强可用”的智能体提升至“真正实用”的水平？扣子的核心解决思路有三点：

一是摒弃泛化、定义模糊的“通用智能体”概念，深入特定领域与具体场景，构建针对性强的智能体；
二是配备“扣子罗盘”类运维工具，精准诊断智能体问题。智能体的构建与优化必须通过反复的测试、评估和调优，才能将其能力从及格的 60 分提升至优秀的 90 分；
三是持续洞察用户需求，通过迭代调优（如增减工具、优化逻辑），逐步扩展和完善智能体的能力边界，最终实现能力的深度覆盖与复用。

虽然技术热门方向一直在快速变化，但扣子团队认为这些“均在扣子产品初始规划的技术框架考量范围内。”

具体而言，无论是插件机制还是上下文工程，都属于扣子现有框架的组成部分。“无论 MCP 或上下文工程等我们都有较为完备的技术储备。当然，我们始终保持开放态度，密切关注未来可能出现的新技术趋势或应用模式。如有必要，我们将积极响应并跟进，确保扣子始终作为最前沿的智能体开发平台。”

结束语

未来 6-12 个月里，在扣子团队看来有两个趋势是确定的：模型能力将持续进步，这将解锁更多应用场景与使用方式；更多企业将产生对 Agent 或 AI 应用的需求，AI 行业渗透率持续提升。

围绕上述趋势，扣子将重点推进三大战略方向：

持续提升核心模型推理与集成引擎的技术水平，具体包括针对市场主流模型（闭源与开源），提供无缝适配与深度优化；持续优化引擎性能、稳定性，并降低模型使用成本；
大幅降低开发门槛，使非技术背景用户也能轻松上手，包括进一步简化工具、降低学习曲线；丰富官方插件库及调试工具，提升开发便捷性等。
建立有效的开源贡献者激励机制，吸引开发者共同贡献，将扣子打造成为开发社区中繁荣且健康的标杆项目。

能够自主运行、协同完成复杂任务甚至超越当前人类能力，这既是智能体未来发展的目标，也是行业高度期待的方向。但在达成目标的路上，智能体仍面临诸多持续性挑战，比如：如何确保智能体的行为符合预期、避免发生不可预见的偏离；当前 AI 仅应用于生产环节的有限部分，随着未来用量激增，如何有效控制并进一步降低其运行成本？还有诸如长链条推理和复杂规划的任务的能力突破、确保智能体调用接口可信等问题都有待解决。

面对各种挑战，开源只是扣子在前进路上的一大步。开源版扣子能否真正实现团队预设的目标、这次开源大动作会让 Agent 平台之争如何演变？不妨保持期待。

本文为 InfoQ 独家原创报道，未经授权请勿转载，如摘录引用需明确注明出处。