整理｜华卫

昨日，智谱交出了 2025 年度业绩报告，这是其上市近三个月后的首份年度财报。今年 1 月 8 日，智谱登陆港交所，股价从发行价 116.2 港元一度冲至近 700 港元，目前市值超 3000 亿港元。

这份业绩报告喜忧参半，其收入激增但亦被分析师评增长低于预期，且综合毛利率不佳。智谱表示，公司预计通过收入增长和提升运营效率实现盈利，但尚未给出具体时间表。智谱还在财报中传达了一个信号，将继续加大投资，增加国产芯片在训练模型中的使用。

营收翻倍增长，亏损同比扩大

财报显示，智谱 2025 年营收 7.24 亿元，同比增长 131.9%；毛利 2.97 亿元，同比增长 68.7%；毛利率为 41.0%，较上年的 56.3%下降 15.3 个百分点；年内亏损 47.18 亿元，同比扩大 59.5%；经调整后净亏损 31.82 亿元，同比扩大 29.1%；研发投入 31.8 亿元，同比增长 44.9%。

从营收情况来看，智谱是一家典型的大模型公司：收入增长很快，但亏损巨大；研发投入仍然非常重，强度达营收的 4.4 倍。此外，智谱的毛利率下降明显，整体综合毛利率由 2024 年的 56.3%降至 41.0%。

收入结构上，智谱 2025 年以本地化部署服务为主。其中，本地化部署服务收入 5.34 亿元，同比增长 102.3%，占总收入的 73.7%；云端部署服务收入 1.90 亿元，同比增长 292.6%，占比 26.3%。需要注意的是，2025 年智谱这两种服务模式的毛利率变化不一。云端部署毛利率从上年的 3.3%提升到 18.9%，改善不小；但本地化部署毛利率则从 66.0%下降到 48.8%。

财报中对此的解释是，云端部署业务主要由于模型推理效率提升、算力规模扩张导致边际成本递减，同时价格有所增加；即通过对推理侧的极致工程优化，在大幅度降低单位成本的同时，实现了毛利表现的稳健提升；本地化部署业务由于为满足客户需求而投入了更多的交付资源。

具体按业务形态与核心产品线来拆分，智谱 2025 年的企业级通用大模型收入 3.66 亿元，占比 50.4%；开放平台及 API 收入 1.90 亿元，占比 26.3%；企业级智能体收入 1.66 亿元，占比 22.9%；技术服务及其他收入占比低。

值得一提的是，智谱所有业务收入相较 2024 年均同比增长。其中，企业级通用大模型收入增幅达 70.5%，开放平台及 API 的收入增幅达 292.6%，企业级智能体收入增幅达 248.8%，技术服务及其他收入增幅达 31.6%。

Token 价值大增，核心指标直追 Anthropic 水平

“‘智能上界的突破’是这个时代唯一的物理第一性。如果说智能上界决定了技术的定价权，那么 Token 的消耗规模则决定了商业价值的体量。”智谱在财报中称，其内部推导出了一个简洁的公式： AGI 商业价值=智能上界×Token 消耗规模。2025 年，随着 GLM 在编程(Coding)与智能体(Agent)等元场景的深度渗透，智谱付费 Token 消耗量实现了指数级跃迁。凭借 GLM 系列，智谱实现了从开发者生态到全球化 MaaS (Model-as-a-Service)平台的全面爆发。

据了解，在稍晚的智谱年度业绩发布电话会上，智谱 CEO 张鹏进一步提出了“Token 架构力”（Token Architect）新概念，将 AI 生产力价值定义为“智能调用量 × 智能质量 × 经济转化效率”。并且，张鹏表示，“当模型足够强，API 本身就是最好的商业模式。”

在业务模式上，智谱一直对标 Anthropic。Anthropic 的 CEO Dario Amodei 曾透露，公司 60%至 75%的收入来自 API，且明确将编程作为核心用例，因为"企业用例为模型改进提供了更强的激励"。智谱此次发布的财报中，表演最亮眼的也来自 API 平台。

财报显示，截至报告期末，智谱 API 平台 ARR 实现 17 亿元，过去一年提升 60 倍。2025 年推出的 GLM Coding Plan，付费开发者规模突破 24.2 万。GLM-5 发布后 24 小时内即获得字节、阿里、腾讯等头部大厂官方接入，中国前 10 大互联网公司中已有 9 家深度集成 GLM。2026 年 3 月推出的 Claw Plan 上线仅两天订阅用户即破 10 万，上线 20 天订阅用户突破 40 万。截至 2026 年 3 月，智谱的平台注册企业及用户突破 400 万，服务全球超过 218 个国家及地区。

张鹏强调，智谱 API 价格在 2026 年一季度上调 83%后，市场依然供不应求，调用量增长 400%。在今年第一季度，智谱对 API 价格进行两次上调。2 月，智谱主动上调价格 30%并取消首购优惠。

人人都是“Token 架构师”，告别 App 堆叠

“智谱不是一家传统意义上的软件公司，我们是一个以 AGI 为信仰的原生智能实验室。”在财报中，智谱预测道，2026 年，智能范式将从轻量化的 Vibe Coding（氛围编程）向工业级的 Agentic Engineering（智能体工程）演变，再进化为具备自主规划、环境感知与自我迭代能力的数字工程师，最终实现跨越多步迭代、具备逻辑一致性的 Long-horizon Task（长程任务）闭环执行，这将进一步带来智能上界的突破与 Token 调用的指数级增长。

而当大模型具备长程任务执行的闭环能力后，核心竞争力将重塑为 TAC（Token Architecture Capability, Token 架构能力）。TAC = 智能调用量×智能质量×经济转化效率。未来，衡量一个个体或组织价值的标准，不再是掌握了多少信息，而是其作为 Token 架构师，在给定预算下构建复杂 Agent 系统并驱动大模型完成复杂 Agent 系统的自主运行。“智谱的目标是成为提升全社会 TAC 的基础设施，让每一滴 Token 都能转化为可交付的经济增量。”

随着 OpenClaw 等应用驱动的 Token 消耗进入指数级轨道，一场智能输出革命正在发生。首先是推理再中心化：凭借超大规模集群的规模经济与极致的推理优化，云端大参数基模的效率将进一步提高。其次高质量 Token 出海。据了解，GLM-5 的国产化适配已超越简单的算子移植，进入了 Co-design（软硬协同设计）阶段。在底层内核层面，通过 Lightning Indexer 等定制化融合内核与 FlashComm 通信优化，最大限度隐藏了内存访问与通信延迟，这种深度调优让 GLM 系列在国产芯片上跑出了比肩国际顶级芯片的推理效率。

进入 2026 年，算力范式正在发生剧变，OpenClaw 的爆发式应用提前引燃了 Token 消耗狂潮。智谱称，他们将继续加大投入，尤其是深耕国产芯片的“Day 0”适配与软硬一体化调优。“我们将推理性能压榨至极限，不是为了短期盈利，而是为了支撑那条不断上扬的、高质量 Token 消耗的指数曲线。”

同时，智谱指出，大模型正在吞噬软件，未来的计算平台将不再是 App 的堆叠，而是 API 商店与 Agent 矩阵的协同。在 LLM-OS 架构下，模型直接理解模糊意图、拆解长程任务并调度全栈资源。谁的模型进入了系统内核，谁就掌握了下一代计算的定义权。

参考链接：

https://www1.hkexnews.hk/listedco/listconews/sehk/2026/0331/2026033101550_c.pdf

创作场景

智谱 AI 财报炸场，Token 价值暴涨、核心指标直追 Anthropic 水平！CEO 张鹏：人人都将是“Token 架构师”

营收翻倍增长，亏损同比扩大

Token 价值大增，核心指标直追 Anthropic 水平

人人都是“Token 架构师”，告别 App 堆叠