写点什么

不靠低价抢客户,月之暗面 Kimi 出海,凭什么硬刚海外 AI“御三家”?

  • 2026-06-29
    北京
  • 本文字数:3267 字

    阅读完需:约 11 分钟

月之暗面 Kimi 正在 C 端爆款产品之外,加速布局 B 端模型服务和全球化市场。

 

月之暗面 Kimi B 端负责人黄震昕表示,Kimi 的定位并不是做最便宜的模型,而是希望做最高性能的模型。在他看来,无论 To C 还是 To B,本质上都是探索智能上限的不同方式。随着 AI 对生产力结构的改变越来越明显,Kimi 正在围绕 Coding、Agent、长链路推理、多模态理解和企业级应用场景,寻找模型能力进入真实业务流程的路径。

 

差异化优势:做 All in one 模型

 

面对海外头部模型的强势竞争,Kimi 希望通过差异化能力进入全球企业的核心业务流程。黄震昕向 InfoQ 表示,Kimi 最终的目标是希望探索智能的上限,希望能和海外那三家模型“掰一掰手腕”。

 

据介绍,Kimi 的一个重要特色是 All in one。它将视觉理解、Coding 和 Agent 能力融合在一个模型中,而不是将视觉能力作为外接模块单独处理。有些模型会使用类似“XXX-VL”版本来处理视觉任务,但视觉并没有完全融合进去。

 

“我们在预训练阶段就已经把视觉数据和文本数据放在一起训练,带来的好处是我们能做一些全球其他厂商不太能做到的能力,比如 Visual-to-Code,把视觉动效直接用代码实现出来。”黄震昕说道。

 

Kimi 近期还与字节跳动的 Trae 上线了 Visual Debug 功能。开发者遇到 Bug 时,可以直接录屏或截图标识问题,模型便能理解视觉信息与代码上下文,并给出修复方案。这背后是因为 Kimi 团队观察到,大量程序员已经习惯直接丢一张图或录屏给模型做 Debug,Kimi 在“视觉+ Coding”的混合场景上有明显优势。

 

短期内 Kimi 仍会更多专注模型,因为模型本身还有大量事情要做,把模型做好已经很不容易。

 

这也体现在人才选择上,月之暗面当前依然优先招聘“最聪明、最天才的人”,让他们去做创新。公司会在研发上提供行业内较高的人均算力和卡数支持,技术和 BD 团队中也有大量毕业于哈佛、斯坦福、康奈尔等高校的成员,人才密度较高。公司整体也非常年轻,尤其在算法和模型底层研发领域,年轻研发人员往往能爆发出更强创新力。团队成员保持个性,又围绕共同目标紧密协作。公司希望每个人都具备审美,做出来的产品不仅要有能力,也要“漂亮”。

 

但黄震昕也承认,企业级 Agent 的渗透并不是“只提供模型就行”。Coding 场景相对容易在企业内部扩散,但更复杂的 Agent 要进入企业业务流程,需要最后一公里服务。因此,Kimi 会更多选择与亚马逊云科技以及其他合作伙伴合作,由伙伴补齐行业理解、流程改造、系统集成和端到端交付能力。

 

不过,Kimi 并不打算变成一家重交付公司。黄震昕表示,企业 AI 落地仍需要“最后一公里”服务,因此 Kimi 也在积极寻找 FDE。就公司自身而言,月之暗面仍会保持对模型的专注,不会做过重的系统集成和交付工作。

 

进入全球企业核心业务

 

全球化是 Kimi 的重要方向。

 

目前,Kimi 已经拥有大量海外用户,场景包括 Coding、Agent 等。黄震昕表示,无论技术推广、开源还是服务,Kimi 都是全球统一推进,“Day 1 就是这么做的”。

 

在海外拓展中,亚马逊云科技是 Kimi 的关键合作伙伴。Kimi 与亚马逊云科技的合作是“飞轮式”的。一方面,Kimi 会采购亚马逊云科技全球云基础设施、算力等服务;另一方面,也希望通过亚马逊云科技的渠道销售 Kimi 服务。

 

目前,Kimi 已通过两种路径与亚马逊云科技展开合作。

 

首先,上线亚马逊云科技 Marketplace。该模式下,用户通过 亚马逊云科技 Marketplace 购买 Kimi  API 服务,采用的是标准化采购与按量计费机制触达更广泛的用户群体,该路径主要解决的是全球分发与企业采购效率问题。

 

更深层的合作则指向 Amazon Bedrock。目前,亚马逊云科技 Amazon Bedrock 已经接入了 Kimi K2.5 等开源模型,未来 Kimi 正在积极推进接入更多最新模型,让用户无需自行管理基础设施或单独部署服务器就能使用 Kimi 模型。这意味着双方合作将从“渠道接入”进一步升级为“基础设施级托管”。同时,Kimi 也在与亚马逊云科技探讨将自身底层推理优化能力(如缓存与推理加速能力)开放,使不同接入渠道下的推理性能体验保持一致。

 

当前,Kimi 的企业客户已不局限于互联网行业,金融、制造、教育、医疗等行业也都有不少客户与 Kimi 深度合作。

 

合作模式通常是由 Kimi 提供基础模型能力,亚马逊云科技提供行业经验与客户资源,并联合解决方案架构师共同设计从模型接入、数据接入到业务流程落地的完整路径,用于支持各种场景。另外,针对不同区域与行业的合规与数据要求,亚马逊云科技在安全、隐私与合规体系上的成熟经验也成为合作的重要支撑。

 

此外,由于大模型推理资源整体仍处于紧张状态,Kimi 在不同渠道存在 TPM(每分钟 token 配额)管理机制。针对亚马逊云科技等重点合作渠道,Kimi 会提供更稳定的算力与配额保障,以支撑企业级使用需求。

 

不做娱乐化,坚持生产力方向

 

Kimi 明确强调生产力导向。在所有大模型公司里,月之暗面算是非常有个性,不做娱乐场景,而是专注生产力。

 

在 C 端,Kimi 已形成一系列生产力产品能力,包括用户熟悉的长文本能力、PPT 能力、深度研究,以及近期发布的 Kimi Work。Kimi 也在发力 Agent 集群等能力,让用户可以同时创建多个智能体协同完成任务。

 

而在 B 端,Kimi 主要通过 API 方式服务客户,当前重点场景包括 Coding 和 Agent。

 

Kimi 的 B 端业务不是单一模型接口,而是一个分层服务体系:最底层提供基础模型能力;往上提供多类 API,包括模型 API、搜索 API,以及未来可能开放的 PPT API、深度研究 API 等;再往上提供 Agent SDK,帮助企业更快基于 Kimi 的模型和 Harness 能力构建内部 Agent;最上层则是面向企业的产品层,包括企业版 Kimi,以及 Kimi Agent、Kimi Code、Kimi Work 等能力。

 

在技术路线上,Kimi 强调的不只是模型效率优化,而是模型底层创新。黄震昕表示,Kimi 非常坚定地相信 Scaling Law 仍将持续向前,也会持续解决 Scaling Law 推进过程中遇到的各种卡点,包括模型架构层面的关键问题。

 

他进一步解释,行业中不少公司更关注产品层协同设计、上下文长度、推理速度、数据清洗等多维度 scaling。Kimi 并不是不做这些,相反,无论是预训练还是后训练,这些方向内部都在推进,公司也有专门的 Harness team 在各种场景中做尝试。Kimi 不同的点在于,有自己的“登月目标”,不会因为底层架构创新极难就绕开。“只有在底层架构上实现突破,才能做更大的模型,才能让 Scaling Law 持续向前。”

 

围绕智能体,Kimi 持续在三个方向进行优化:Token 效率、长上下文能力与多智能体协作。底层的技术创新包括通过 Muon 二阶优化器提升数据利用效率(Muon 已被 GLM、 DeepSeek V4 等模型采用);通过“注意力残差”提升模型网络架构的效率;通过 Kimi Linear 降低长序列计算成本增长曲线。

 

今年以来,Harness 对大模型实际应用表现的影响受到关注。不过,随着基础模型能力增强,行业中也出现了 Harness 重要性是否会弱化的讨论。

 

黄震昕认为,随着基础模型变强,它确实能更好兼容不同环境,从而降低对复杂外部 Harness 的依赖。因此,基座模型厂商不能只盯着现有 Harness,而要向更远的前沿技术看。据悉,Kimi 内部已经开始实践新的 Loop Engineering,即循环工程。相比 Harness,Loop Engineering 会更加简洁,代表了一个新的阶段。

 

另外,在生产力方面,价格是个不得不面对的问题。今年以来所有模型厂商其实都在涨价,核心原因是全球算力成本上涨,无论海外还是国内,芯片供应都跟不上 token 需求增长,算力成本最终传导到模型侧。

 

Kimi 希望通过技术优化提升用户性价比、降低实际使用成本。一个关键手段就是 Cache 优化。

 

黄震昕表示,Kimi 一直在优化 Infra,将 Cache 命中率提升到很高水平。“只要 Cache 命中,成本就会显著降低。”Cache 命中率 90% 多和 70% 到 80% 相比,实际成本可能相差数倍。当前,在 OpenRouter 上,Kimi 原厂模型供应商的 Cache 命中率超过 90%,位居前列。他提醒道,用户评估模型价格时,不能只看输入输出 token 单价,更要看 Cache 命中率。

 

面对未来的 token 价格变化,黄震昕认为,只要未来客户获得的是更强模型和更高性价比,即便价格有波动,整体体验仍会提升。