不靠低价抢客户，月之暗面Kimi出海，凭什么硬刚海外AI“御三家”？

月之暗面 Kimi 正在 C 端爆款产品之外，加速布局 B 端模型服务和全球化市场。

月之暗面 Kimi B 端负责人黄震昕表示，Kimi 的定位并不是做最便宜的模型，而是希望做最高性能的模型。在他看来，无论 To C 还是 To B，本质上都是探索智能上限的不同方式。随着 AI 对生产力结构的改变越来越明显，Kimi 正在围绕 Coding、Agent、长链路推理、多模态理解和企业级应用场景，寻找模型能力进入真实业务流程的路径。

差异化优势：做 All in one 模型

面对海外头部模型的强势竞争，Kimi 希望通过差异化能力进入全球企业的核心业务流程。黄震昕向 InfoQ 表示，Kimi 最终的目标是希望探索智能的上限，希望能和海外那三家模型“掰一掰手腕”。

据介绍，Kimi 的一个重要特色是 All in one。它将视觉理解、Coding 和 Agent 能力融合在一个模型中，而不是将视觉能力作为外接模块单独处理。有些模型会使用类似“XXX-VL”版本来处理视觉任务，但视觉并没有完全融合进去。

“我们在预训练阶段就已经把视觉数据和文本数据放在一起训练，带来的好处是我们能做一些全球其他厂商不太能做到的能力，比如 Visual-to-Code，把视觉动效直接用代码实现出来。”黄震昕说道。

Kimi 近期还与字节跳动的 Trae 上线了 Visual Debug 功能。开发者遇到 Bug 时，可以直接录屏或截图标识问题，模型便能理解视觉信息与代码上下文，并给出修复方案。这背后是因为 Kimi 团队观察到，大量程序员已经习惯直接丢一张图或录屏给模型做 Debug，Kimi 在“视觉+ Coding”的混合场景上有明显优势。

短期内 Kimi 仍会更多专注模型，因为模型本身还有大量事情要做，把模型做好已经很不容易。

这也体现在人才选择上，月之暗面当前依然优先招聘“最聪明、最天才的人”，让他们去做创新。公司会在研发上提供行业内较高的人均算力和卡数支持，技术和 BD 团队中也有大量毕业于哈佛、斯坦福、康奈尔等高校的成员，人才密度较高。公司整体也非常年轻，尤其在算法和模型底层研发领域，年轻研发人员往往能爆发出更强创新力。团队成员保持个性，又围绕共同目标紧密协作。公司希望每个人都具备审美，做出来的产品不仅要有能力，也要“漂亮”。

但黄震昕也承认，企业级 Agent 的渗透并不是“只提供模型就行”。Coding 场景相对容易在企业内部扩散，但更复杂的 Agent 要进入企业业务流程，需要最后一公里服务。因此，Kimi 会更多选择与亚马逊云科技以及其他合作伙伴合作，由伙伴补齐行业理解、流程改造、系统集成和端到端交付能力。

不过，Kimi 并不打算变成一家重交付公司。黄震昕表示，企业 AI 落地仍需要“最后一公里”服务，因此 Kimi 也在积极寻找 FDE。就公司自身而言，月之暗面仍会保持对模型的专注，不会做过重的系统集成和交付工作。

进入全球企业核心业务

全球化是 Kimi 的重要方向。

目前，Kimi 已经拥有大量海外用户，场景包括 Coding、Agent 等。黄震昕表示，无论技术推广、开源还是服务，Kimi 都是全球统一推进，“Day 1 就是这么做的”。

在海外拓展中，亚马逊云科技是 Kimi 的关键合作伙伴。Kimi 与亚马逊云科技的合作是“飞轮式”的。一方面，Kimi 会采购亚马逊云科技全球云基础设施、算力等服务；另一方面，也希望通过亚马逊云科技的渠道销售 Kimi 服务。

目前，Kimi 已通过两种路径与亚马逊云科技展开合作。

首先，上线亚马逊云科技 Marketplace。该模式下，用户通过亚马逊云科技 Marketplace 购买 Kimi API 服务，采用的是标准化采购与按量计费机制触达更广泛的用户群体，该路径主要解决的是全球分发与企业采购效率问题。

更深层的合作则指向 Amazon Bedrock。目前，亚马逊云科技 Amazon Bedrock 已经接入了 Kimi K2.5 等开源模型，未来 Kimi 正在积极推进接入更多最新模型，让用户无需自行管理基础设施或单独部署服务器就能使用 Kimi 模型。这意味着双方合作将从“渠道接入”进一步升级为“基础设施级托管”。同时，Kimi 也在与亚马逊云科技探讨将自身底层推理优化能力（如缓存与推理加速能力）开放，使不同接入渠道下的推理性能体验保持一致。

当前，Kimi 的企业客户已不局限于互联网行业，金融、制造、教育、医疗等行业也都有不少客户与 Kimi 深度合作。

合作模式通常是由 Kimi 提供基础模型能力，亚马逊云科技提供行业经验与客户资源，并联合解决方案架构师共同设计从模型接入、数据接入到业务流程落地的完整路径，用于支持各种场景。另外，针对不同区域与行业的合规与数据要求，亚马逊云科技在安全、隐私与合规体系上的成熟经验也成为合作的重要支撑。

此外，由于大模型推理资源整体仍处于紧张状态，Kimi 在不同渠道存在 TPM（每分钟 token 配额）管理机制。针对亚马逊云科技等重点合作渠道，Kimi 会提供更稳定的算力与配额保障，以支撑企业级使用需求。

不做娱乐化，坚持生产力方向

Kimi 明确强调生产力导向。在所有大模型公司里，月之暗面算是非常有个性，不做娱乐场景，而是专注生产力。

在 C 端，Kimi 已形成一系列生产力产品能力，包括用户熟悉的长文本能力、PPT 能力、深度研究，以及近期发布的 Kimi Work。Kimi 也在发力 Agent 集群等能力，让用户可以同时创建多个智能体协同完成任务。

而在 B 端，Kimi 主要通过 API 方式服务客户，当前重点场景包括 Coding 和 Agent。

Kimi 的 B 端业务不是单一模型接口，而是一个分层服务体系：最底层提供基础模型能力；往上提供多类 API，包括模型 API、搜索 API，以及未来可能开放的 PPT API、深度研究 API 等；再往上提供 Agent SDK，帮助企业更快基于 Kimi 的模型和 Harness 能力构建内部 Agent；最上层则是面向企业的产品层，包括企业版 Kimi，以及 Kimi Agent、Kimi Code、Kimi Work 等能力。

在技术路线上，Kimi 强调的不只是模型效率优化，而是模型底层创新。黄震昕表示，Kimi 非常坚定地相信 Scaling Law 仍将持续向前，也会持续解决 Scaling Law 推进过程中遇到的各种卡点，包括模型架构层面的关键问题。

他进一步解释，行业中不少公司更关注产品层协同设计、上下文长度、推理速度、数据清洗等多维度 scaling。Kimi 并不是不做这些，相反，无论是预训练还是后训练，这些方向内部都在推进，公司也有专门的 Harness team 在各种场景中做尝试。Kimi 不同的点在于，有自己的“登月目标”，不会因为底层架构创新极难就绕开。“只有在底层架构上实现突破，才能做更大的模型，才能让 Scaling Law 持续向前。”

围绕智能体，Kimi 持续在三个方向进行优化：Token 效率、长上下文能力与多智能体协作。底层的技术创新包括通过 Muon 二阶优化器提升数据利用效率（Muon 已被 GLM、 DeepSeek V4 等模型采用）；通过“注意力残差”提升模型网络架构的效率；通过 Kimi Linear 降低长序列计算成本增长曲线。

今年以来，Harness 对大模型实际应用表现的影响受到关注。不过，随着基础模型能力增强，行业中也出现了 Harness 重要性是否会弱化的讨论。

黄震昕认为，随着基础模型变强，它确实能更好兼容不同环境，从而降低对复杂外部 Harness 的依赖。因此，基座模型厂商不能只盯着现有 Harness，而要向更远的前沿技术看。据悉，Kimi 内部已经开始实践新的 Loop Engineering，即循环工程。相比 Harness，Loop Engineering 会更加简洁，代表了一个新的阶段。

另外，在生产力方面，价格是个不得不面对的问题。今年以来所有模型厂商其实都在涨价，核心原因是全球算力成本上涨，无论海外还是国内，芯片供应都跟不上 token 需求增长，算力成本最终传导到模型侧。

Kimi 希望通过技术优化提升用户性价比、降低实际使用成本。一个关键手段就是 Cache 优化。

黄震昕表示，Kimi 一直在优化 Infra，将 Cache 命中率提升到很高水平。“只要 Cache 命中，成本就会显著降低。”Cache 命中率 90% 多和 70% 到 80% 相比，实际成本可能相差数倍。当前，在 OpenRouter 上，Kimi 原厂模型供应商的 Cache 命中率超过 90%，位居前列。他提醒道，用户评估模型价格时，不能只看输入输出 token 单价，更要看 Cache 命中率。

面对未来的 token 价格变化，黄震昕认为，只要未来客户获得的是更强模型和更高性价比，即便价格有波动，整体体验仍会提升。

创作场景

不靠低价抢客户，月之暗面 Kimi 出海，凭什么硬刚海外 AI“御三家”？

差异化优势：做 All in one 模型

进入全球企业核心业务

不做娱乐化，坚持生产力方向