
近些年,AI 对软件开发领域的渗透不断加深。从 2022 年的编程辅助工具兴起,到 2023 年自主智能体 Devin 引发行业关注,再到 2024 年以 Cursor 为代表的产品重新定义 IDE 形态,自然语言编程已成为 AI 编程产品的主流形态,越来越多的工具开始尝试通过自然语言直接对接开发需求。
在 C 端,尤其个人用户和独立开发者群体中,通用 AI coding 工具表现出色,能够快速生成轻量级应用代码,显著提升开发效率。
然而,根据 Stack Overflow 发布的年度《2025 开发者调查报告》,国内企业级市场的 AI 技术渗透率仍然较低,目前主要集中在头部互联网公司,而大量国有企业及传统企业仍处于观望阶段。这一现状的背后,是企业级 AI 编程面临的特殊挑战。
企业级 AI coding 的痛点
CodeWave 专注于企业级复杂应用开发场景,其目标客户主要包括两类:一是拥有上百甚至上千名研发人员的大型企业,如央企、金融机构,二是依赖软件开发服务商进行定制开发的企业。这些企业通常业务链条长、应用复杂度高,对定制化开发的需求远高于标准化软件采购。
长期服务企业用户过程中,网易数智副总经理、网易 CodeWave 总经理王桐发现,通用 AI coding 工具落地到企业级复杂应用开发时,常常暴露出三大问题:
首先,代码质量不可控。企业级应用,如 ERP 模块、供应链系统等,往往需要 6-7 人团队开发半年以上,业务逻辑复杂。并且,国有企业对代码安全和架构规范性要求极高,而通用 AI 工具生成的代码多适配国外主流技术栈,与国内企业的技术规范脱节,易出现安全漏洞。
其次,可维护性差。通用工具一次可能生成数百行代码,但开发人员需要理解代码逻辑才能进行后续迭代,这比接手“他人代码”更困难:AI 生成的代码缺乏业务上下文,多人协作时难以对齐需求,后续调试、修改成本极高,违背了“提效”的初衷。
最后,业务理解泛化。企业级应用多为垂直领域需求,通用工具缺乏行业知识积累,无法有效复用企业过往的开发资产(如历史系统、私有知识库),生成的代码难以贴合具体业务场景。
“这也是为何国内 KA 企业的 AI coding 采购渗透率低,并非企业不认可 AI 价值,而是通用工具无法解决‘复杂应用+规范管控’的核心需求。”王桐说道。
通过客户调研和内部实践发现,网易 CodeWave 技术负责人姜天意指出,通用 AI 编程工具在国内企业级场景中主要存在三大“水土不服”的问题:
模型表现与技术栈脱节。国内主流 AI 编程 IDE 依赖 Google Gemini、GPT-4 等国外模型时效果较好,但适配国内自主模型后,代码生成质量明显下降;同时国外模型对国内企业个性化的开发框架、架构设计、业务知识掌握不足,生成的代码难以复用;
自然语言无法描述复杂逻辑:企业级应用的业务逻辑错综复杂,而自然语言本身存在“歧义性”,难以精准传递需求,导致全自动智能开发模式无法落地;
代码采纳率与提效预期不符:虽然业内不少企业称 AI 生成代码的采纳率为 60%-80%,但网易内部代码库的实际采纳率仅 20%-30%。AI 生成的代码仍需开发者大量补充和修改,并未真正降低开发门槛;多数客户采购 Copilot 类产品后,都未达到规模化落地的预期。
这些痛点的核心在于:通用 AI 工具只解决了“代码生成”单一环节,未覆盖企业级开发的“规范、可控、全流程”需求。
基于对企业级需求的深入洞察,CodeWave 提出了“可控的 AI coding”定位:不做通用 C 端工具,而是将 AI 能力与原有开发底座融合,聚焦企业级复杂应用,实现“提效”与“可控”的平衡。
10 月 14 日,CodeWave 对外发布多项智能开发能力,支持从需求梳理、产品构思、开发部署、迭代等全流程研发智能化,其采用可视化与 AI 融合的开发方式,同时保留人工布局与精细调整的空间,进而打造更可控、更规范、更落地的智能开发模式。
CodeWave 的解法
最新能力的发布得益于 CodeWave 的长年积累。
围绕“解决企业级实际痛点”,CodeWave 从 2023 年开始布局 AI 能力,至今经历了四个关键阶段,其核心思路是以低代码为底座,约束 AI 的“不可控”,同时借 AI 弥补低代码的“灵活性”短板;从“单一环节提效”到“全流程覆盖”,从“定性效果”到“定量数据”。
2023 年至 2024 年初,团队发现传统低代码平台虽然能够覆盖复杂应用开发,但需要开发者学习可视化设计器的操作逻辑,门槛较高,且依赖“拖拽”的方式难以快速响应灵活需求。为此,团队探索了“可视化+AI”的创新路径。
团队在 CodeWave 中定义了一套统一的领域特定语言 NASL(NetEase Application Specific Language)。作为 Web 应用开发的“高级抽象层”,NASL 涵盖页面逻辑、数据定义、数据查询等核心概念,不依赖具体技术栈。开发者无需手动拖拽,可通过自然语言交互让 AI 识别需求并生成对应的可视化界面,同时通过 NASL 的类型检查和翻译器确保生成内容符合企业规范。这一阶段,团队推出了对话式代码生成、SQL 生成、代码解读等功能,有效解决了低代码“入门难”的问题,并在多个商业交付项目中验证了“AI+低代码”模式的可行性。
在企业级商业交付场景中,需要用“数据说话”来明确“AI 到底提升多少效率”“准确率如何”。2024 年中,团队开始向数据驱动转型,重点解决此前 AI 功能“效果不可量化、私有化模型能力弱”的问题。
团队参考行业 SOTA 方法,建立了完整的数据驱动模型迭代体系:构建场景化 Benchmark 评测体系,设立准确率、展示率、留存率等核心指标;通过“原开发时长-AI 辅助后时长”“修改成本占比”等维度构建可量化的提效公式,为企业 IT 决策提供数据支撑;定期运行基准测试,将线上用户数据回流至模型训练集,推动模型持续优化,确保 AI 功能稳定提升。
到了 2024 年底,针对低代码平台“难以覆盖高度个性化场景”以及 AI 只覆盖“代码生成”单一环节的局限,团队进行了新一轮能力升级。
在复杂组件与个性化场景方面,实现让非技术人员(如运营、产品经理)通过自然语言描述需求,由 AI 生成复杂前端组件,无需高代码研发介入。功能上线两个多月内,创建和迭代组件超过 1800 次,组件开发成本从 0.5 天降至 0.5 小时,降幅超过 60%。针对游戏、营销等高度个性化场景,实现了将 PSD 设计稿直接转换为可持续调优的页面,将营销页面开发周期从“数天”缩短至“1 天”,弥补了低代码在个性化场景的短板。
此外,团队在 2024 年 7 月推出了“智能产品助手”(内部代号 PMKiller),解决研发前流程的效率痛点:通过 AI 生成 PRD、竞品分析和原型设计,生成的原型可直接导入 CodeWave 平台,转换为包含页面逻辑、数据结构的全栈应用,实现了“需求→原型→设计→代码→发布”的全链路闭环。
王桐强调,目前市场上已有工具能够从需求直接生成最终工程化交付物,但这些工具多适用于 C 端短期或一次性需求,无需掌控底层逻辑;而企业级市场由于需要长期使用和自主可控,必须透明化底层逻辑,因此团队不会选择“一步生成”的模式,而是保留人机协作的中间过程。实际上,产品与需求人员需要确认可视化交互是否匹配 PRD 等,资深工程师则需要介入复杂逻辑的实现、系统调试与优化。
未来:需求和实现的对齐
展望未来,随着项目量级增大,AI 生成内容越多,开发者的维护难度就越高。企业级复杂应用,如万人使用的供应链系统,需要实现“需求与实现对齐”和“多人协作规范”,这是现有 AI 工具尚无法完全支撑的。
为此,CodeWave 团队计划将多年积累的企业级开发实践,包括架构设计、代码规范、组件资产、质量标准等,与 AI 深度整合,推出 Spectrum 规范驱动开发模式。
这种模式的核心是“规范先行”,让 AI 在企业级复杂应用中既保持“灵活性”又确保“可控性”。具体包括将用户“混乱的需求文档”转化为 AI 友好的“规范需求”;在 AI 辅助下由架构师基于规范需求拆解开发任务,明确各角色职责;通过规范文档实时对齐需求与实现,避免“需求失真”;确保所有 AI 生成内容都基于规范,使多人协作时能够快速追溯需求来源,有效降低维护成本。








评论