整理|华卫
昨日,智谱交出了 2025 年度业绩报告,这是其上市近三个月后的首份年度财报。今年 1 月 8 日,智谱登陆港交所,股价从发行价 116.2 港元一度冲至近 700 港元,目前市值超 3000 亿港元。
这份业绩报告喜忧参半,其收入激增但亦被分析师评增长低于预期,且综合毛利率不佳。智谱表示,公司预计通过收入增长和提升运营效率实现盈利,但尚未给出具体时间表。智谱还在财报中传达了一个信号,将继续加大投资,增加国产芯片在训练模型中的使用。
营收翻倍增长,亏损同比扩大
财报显示,智谱 2025 年营收 7.24 亿元,同比增长 131.9%;毛利 2.97 亿元,同比增长 68.7%;毛利率为 41.0%,较上年的 56.3%下降 15.3 个百分点;年内亏损 47.18 亿元,同比扩大 59.5%;经调整后净亏损 31.82 亿元,同比扩大 29.1%;研发投入 31.8 亿元,同比增长 44.9%。

从营收情况来看,智谱是一家典型的大模型公司:收入增长很快,但亏损巨大;研发投入仍然非常重,强度达营收的 4.4 倍。此外,智谱的毛利率下降明显,整体综合毛利率由 2024 年的 56.3%降至 41.0%。
收入结构上,智谱 2025 年以本地化部署服务为主。其中,本地化部署服务收入 5.34 亿元,同比增长 102.3%,占总收入的 73.7%;云端部署服务收入 1.90 亿元,同比增长 292.6%,占比 26.3%。需要注意的是,2025 年智谱这两种服务模式的毛利率变化不一。云端部署毛利率从上年的 3.3%提升到 18.9%,改善不小;但本地化部署毛利率则从 66.0%下降到 48.8%。

财报中对此的解释是,云端部署业务主要由于模型推理效率提升、算力规模扩张导致边际成本递减,同时价格有所增加;即通过对推理侧的极致工程优化,在大幅度降低单位成本的同时,实现了毛利表现的稳健提升;本地化部署业务由于为满足客户需求而投入了更多的交付资源。
具体按业务形态与核心产品线来拆分,智谱 2025 年的企业级通用大模型收入 3.66 亿元,占比 50.4%;开放平台及 API 收入 1.90 亿元,占比 26.3%;企业级智能体收入 1.66 亿元,占比 22.9%;技术服务及其他收入占比低。

值得一提的是,智谱所有业务收入相较 2024 年均同比增长。其中,企业级通用大模型收入增幅达 70.5%,开放平台及 API 的收入增幅达 292.6%,企业级智能体收入增幅达 248.8%,技术服务及其他收入增幅达 31.6%。
Token 价值大增,核心指标直追 Anthropic 水平
“‘智能上界的突破’是这个时代唯一的物理第一性。如果说智能上界决定了技术的定价权,那么 Token 的消耗规模则决定了商业价值的体量。”智谱在财报中称,其内部推导出了一个简洁的公式: AGI 商业价值=智能上界×Token 消耗规模。2025 年,随着 GLM 在编程(Coding)与智能体(Agent)等元场景的深度渗透,智谱付费 Token 消耗量实现了指数级跃迁。凭借 GLM 系列,智谱实现了从开发者生态到全球化 MaaS (Model-as-a-Service)平台的全面爆发。
据了解,在稍晚的智谱年度业绩发布电话会上,智谱 CEO 张鹏进一步提出了“Token 架构力”(Token Architect)新概念,将 AI 生产力价值定义为“智能调用量 × 智能质量 × 经济转化效率”。并且,张鹏表示,“当模型足够强,API 本身就是最好的商业模式。”
在业务模式上,智谱一直对标 Anthropic。Anthropic 的 CEO Dario Amodei 曾透露,公司 60%至 75%的收入来自 API,且明确将编程作为核心用例,因为"企业用例为模型改进提供了更强的激励"。智谱此次发布的财报中,表演最亮眼的也来自 API 平台。
财报显示,截至报告期末,智谱 API 平台 ARR 实现 17 亿元,过去一年提升 60 倍。2025 年推出的 GLM Coding Plan,付费开发者规模突破 24.2 万。GLM-5 发布后 24 小时内即获得字节、阿里、腾讯等头部大厂官方接入,中国前 10 大互联网公司中已有 9 家深度集成 GLM。2026 年 3 月推出的 Claw Plan 上线仅两天订阅用户即破 10 万,上线 20 天订阅用户突破 40 万。截至 2026 年 3 月,智谱的平台注册企业及用户突破 400 万,服务全球超过 218 个国家及地区。
张鹏强调,智谱 API 价格在 2026 年一季度上调 83%后,市场依然供不应求,调用量增长 400%。在今年第一季度,智谱对 API 价格进行两次上调。2 月,智谱主动上调价格 30%并取消首购优惠。
人人都是“Token 架构师”,告别 App 堆叠
“智谱不是一家传统意义上的软件公司,我们是一个以 AGI 为信仰的原生智能实验室。”在财报中,智谱预测道,2026 年,智能范式将从轻量化的 Vibe Coding(氛围编程)向工业级的 Agentic Engineering(智能体工程)演变,再进化为具备自主规划、环境感知与自我迭代能力的数字工程师,最终实现跨越多步迭代、具备逻辑一致性的 Long-horizon Task(长程任务)闭环执行,这将进一步带来智能上界的突破与 Token 调用的指数级增长。
而当大模型具备长程任务执行的闭环能力后,核心竞争力将重塑为 TAC(Token Architecture Capability, Token 架构能力)。TAC = 智能调用量×智能质量×经济转化效率。未来,衡量一个个体或组织价值的标准,不再是掌握了多少信息,而是其作为 Token 架构师,在给定预算下构建复杂 Agent 系统并驱动大模型完成复杂 Agent 系统的自主运行。“智谱的目标是成为提升全社会 TAC 的基础设施,让每一滴 Token 都能转化为可交付的经济增量。”

随着 OpenClaw 等应用驱动的 Token 消耗进入指数级轨道,一场智能输出革命正在发生。首先是推理再中心化:凭借超大规模集群的规模经济与极致的推理优化,云端大参数基模的效率将进一步提高。其次高质量 Token 出海。据了解,GLM-5 的国产化适配已超越简单的算子移植,进入了 Co-design(软硬协同设计)阶段。在底层内核层面,通过 Lightning Indexer 等定制化融合内核与 FlashComm 通信优化,最大限度隐藏了内存访问与通信延迟,这种深度调优让 GLM 系列在国产芯片上跑出了比肩国际顶级芯片的推理效率。
进入 2026 年,算力范式正在发生剧变,OpenClaw 的爆发式应用提前引燃了 Token 消耗狂潮。智谱称,他们将继续加大投入,尤其是深耕国产芯片的“Day 0”适配与软硬一体化调优。“我们将推理性能压榨至极限,不是为了短期盈利,而是为了支撑那条不断上扬的、高质量 Token 消耗的指数曲线。”
同时,智谱指出,大模型正在吞噬软件,未来的计算平台将不再是 App 的堆叠,而是 API 商店与 Agent 矩阵的协同。在 LLM-OS 架构下,模型直接理解模糊意图、拆解长程任务并调度全栈资源。谁的模型进入了系统内核,谁就掌握了下一代计算的定义权。
参考链接:
https://www1.hkexnews.hk/listedco/listconews/sehk/2026/0331/2026033101550_c.pdf





