李开复：超大模型预训练逐渐寡头化，国内将收敛至 DeepSeek、阿里、字节三家_AI&大模型_褚杏娟

AI实践哪家强？来 AICon，解锁技术前沿，探寻产业新机！了解详情 



 写点什么



大小：2.01M时长：11:42

李开复：超大模型预训练逐渐寡头化，国内将收敛至 DeepSeek、阿里、字节三家

3 月 20 日，零一万物 CEO、创新工场董事长李开复博士接受了彭博社的专访。

在访谈中他表示，DeepSeek 爆红出圈给整个中国大模型行业完成了实质意义上的市场认知教育，随着模型性能的提升与推理成本的下降，2025 年 AI-First B 端、C 端应用都将迎来爆发。另一方面，各地政府也对大模型展现出浓厚的兴趣，都在积极探索如何将 AI 应用到当地优势传统产业中，用产业大模型打造“新质生产力”，进而促进实体经济的增长。

李开复博士以 Windows 内核类比：DeepSeek 是 Windows 内核，而零一万物提供的平台则是 Windows 操作系统、应用程序、UI 界面。没有 Windows 操作系统、应用程序、UI 界面，Windows 内核就无法发挥真正的价值。要真正发挥大模型的价值所在，AI 领域内仍然没有出现自己的“ Windows 操作系统”，零一万物想要做的正是填补这一空缺。

谈及大模型领域未来的竞争格局，李开复博士认为，在中美两国超大模型的预训练都在逐渐寡头化，并且寡头化的程度在不断加大。他预测中国大模型领域未来将会收敛至 DeepSeek、阿里巴巴、字节跳动三家，其中以 DeepSeek 势头最猛；美国则以 xAI 的发展势头最为迅速，但 OpenAI、Anthropic、Google 也都会做出令人敬佩的研发工作。

至于中美之间的 AI 竞赛，李开复博士认为在印证了“需求是创新之母”的同时，DeepSeek 的突破也使得开源模式呈现出压倒性的优势，坚持闭源策略的 OpenAI、Anthropic 等公司，都会面临更大的压力。

今年零一万物做的最大的调整是：不再执着于只推 Yi 模型，采取“开放模型”的策略。此前，零一万物 COO Anita（黄蕙雯）明确表示不会再做万亿以上超大参数模型，“因为我们做不起。”零一现阶段最关注的是能否真正把 AI 推到市场上，让市场不只歌颂 AI，而是真正能用上 AI。

李开复分析，零一做 ToB 产品的优势在于积淀。零一有完整的软硬结合的解决方案，在如何微调、如何对应数据库、如何做机器训练和数据配比上的经验丰富。下面为李开复博士对话全文。

填补 AI 圈还不存在的 Windows

彭博社：今年可谓是人工智能真正渗透各行业的元年，此次我们特邀零一万物 CEO、创新工场董事长李开复博士来深入探讨这一话题。今天也是一个绝佳的时机来和您一起讨论，因为零一万物刚刚对外发布了“万智企业大模型一站式平台”，首发能帮助企业更广泛地部署、应用 DeepSeek 模型的解决方案。能不能请您详细介绍一下这项业务？

李开复：当 DeepSeek 问世的时候，中国迎来了自己的“ChatGPT 时刻”，我们可以称之为“DeepSeek 时刻”。在中国春节假期期间，几乎每个人都在谈论 DeepSeek，许多企业的 CEO 们节后返工马上要求在自己的公司里用上 DeepSeek。他们发现，DeepSeek 是一个非常出色的模型， AI 的表现令人惊叹，但它不能直接赋能公司里面的人力资源、财务和客服等场景，因为开源模型还缺少连接企业数据库、应用程序等必要的中间件。

零一万物认同 DeepSeek 所取得的巨大进步，我们决定全力支持 DeepSeek，让它更好用。我们补充了那些缺失的中间件，开发了易用的使用界面，使 DeepSeek 在企业中变得可用。这就是零一万物于本周一发布的产品——万智企业大模型一站式平台，它在中国大陆和香港地区的初期反响相当不错。

彭博社：这款“万智”新平台背后的考量是怎样的？

李开复：许多人现在都下载了 DeepSeek，也很喜欢使用 DeepSeek。我有一个 CEO 朋友问他的员工：你们都用 DeepSeek 做什么，得到的答案是算命。这是很有意思的用法，你们或许都可以试一试，但目前的 DeepSeek 还无法直接深入到企业级应用里去。

每个企业都有 ERP 和 CRM 数据库，有员工数据等各种分门别类的企业内部信息，企业需要的是具备行业纵深的知识型模型。比如彭博社会希望有一个金融知识渊博的模型，平安保险集团会希望有一个保险专业知识的模型。零一万物发布的平台，就是为了满足这类各行各业的企业级需求。

这就像是如果我交给你 Windows 内核，你可能不知道如何把它用起来，你会需要 Windows 软件操作系统和应用程序界面，还有配套的 Windows 系列应用，Windows 内核才能变得有用。零一万物推出新的万智企业大模型一站式平台，就像是在为 Windows 内核构建可视化界面和操作中台，让 DeepSeek 的基座模型高效便捷地转化为有效的生产力工具。

“超大模型的预训练正在逐渐寡头化”

彭博社：选择 DeepSeek 作为底层架构而非美国模型，是否折射出中美 AI 竞赛格局变化？

李开复：在中美，超大模型的预训练正在逐渐寡头化，并且寡头化的程度在不断加大。虽然未必所有人都认同，但我们的确同时看到开源圈展现出压倒性的优势，OpenAI 和 Anthropic 都相信自己还能训练出远超其他玩家的闭源模型。当他们看到一个性能相近的开源模型时，我想他们可能受到了沉重的打击。OpenAI 在 2024 年的运营成本为 70 亿美元，而 DeepSeek 的运营成本可能只有 OpenAI 的 2%。

各家的模型都很优秀，问题不在于哪家模型性能高出 1%，而是 OpenAI 成本高昂的模型路线是否具有可持续性。OpenAI 每年花费 70 亿美元，面临着巨额亏损。但现在出现了一个竞争对手，将成本低廉数倍的开源模型免费开放给市场，且这个竞争对手资源充沛，目前看来 DeepSeek 有足够的资金储备持续投入模型研发，并已经有效地将计算成本降低了五到十倍。有了这样一个强大的竞争对手，我认为 OpenAI 的萨姆·奥尔特曼可能夜里辗转难眠。

彭博社：那么，你认为 DeepSeek 真的挑战了现有 AI 的商业逻辑吗？另外，无论是在美国还是在中国，AI 的商业落地已经相当规模化。在开源模式占据优势的当下来看，你认为中国市场未来会跑出多少个 AI 大模型？

李开复：我认为很大概率会收拢到三家，DeepSeek、阿里巴巴和字节跳动。他们的模型会随着时间不断迭代进化。

彭博社：这份名单上少了一些公司的名字。

李开复：当然，还会有许多其他公司希望构建他们自己的模型，我们也会拭目以待看是否会有第四、第五个玩家。但即使在这三个中，我看好 DeepSeek 目前最具势头，这也是我们基于它推出新产品的原因。

但我也想指出，关于你问到 AI 模型商品化的问题，我不认为今天的 AI 已经商品化了。我认为，吸纳大量资金训练的基座模型开始趋近同质化，它们成本高昂、越来越难和开源技术竞争，但人工智能技术并没有商品化。

就像 Windows 内核、Linux 内核这些已经比较商品化，但 Windows 软件系统并没有商品化，微软多年还靠此赚了很多钱。零一万物想要做的是填补 AI 圈还不存在的 Windows，并使用 DeepSeek 作为我们类 Windows 的内核之一。

彭博社：那么，你认为现在的 AI 增加了什么价值？对于投资人来说，在思考这个行业的价值增长点时，具体有哪些主要的经济因素？而为什么你认为只有三个玩家的空间？

李开复：的确可能还有第四、第五个，但在多数市场中，大部分的终局最后将以寡头局面收场。第一名赚了很多钱，第二名收支平衡，后头几名多半不能算是成功。在大模型的赛道中，由于底层模型很难直接转化为商业模式，所以情况更加复杂。但一旦你是最终赢家，就有许多方法可以变现。近期我们可以看到的变化是，中美两地的投资人几乎不再下注更多更贵的底层模型公司。他们更愿意投资 AI 应用、消费者应用、AI 基础设施类型的创新企业，还有企业应用的广大市场需求，未来每个应用、千行百业都会被 AI 重塑，这些应用能为企业提供真正的价值。所以，AI 相关的资本正转往这些方向，而不再投入基座模型。

半导体技术封锁的影响

彭博社：半导体技术封锁是否会成为制约中国 AI 发展的一个限制因素？

李开复：我们可以回顾过去来理解这个问题。过去，中国总是能够在底层技术方面迎头赶上，并构建出伟大的工程产品，而美国更擅长取得前沿突破。我曾经在《AI 未来》这本书中深入论述这点，这种情况目前来看仍在继续。

如今我们看到 DeepSeek 展现出了极强的适应性和竞争力，再次证明了“需求是创新之母”这一观点。因为他们拥有比美国大厂少很多的 GPU，所以不得不设法把已有 GPU 的效率提高 10 倍。正因为 DeepSeek 拥有计算资源比美国大厂少了几个数量级的，反而被迫更加精益求精，倒逼出的技术创新使得他们的模型训练和推理成本比 OpenAI 和其他公司低五到十倍，让全球刮目相看。

彭博社：大约几个月前，在 2024 年的 10 月份我们曾经有过一次交流，当时零一万物也推出了与 DeepSeek 相似的模型，并且早于 DeepSeek 发布 V3 之前。您如何看待模型迭代的频率？这种频率是被什么因素主导？DeepSeek 的成功是一种趋势使然，还是产品本身的魅力？今年，大模型行业又会给我们什么样的惊喜？

李开复：中国大模型行业的竞争仍会热火朝天好一段时间，最终可能有三个赢家，美国可能有四个赢家，但这并不意味着其他几十家公司会放弃竞争，所以我判断那些正在快速发展壮大的公司会继续高频发布新的模型和产品。在我看来，xAI、DeepSeek 是发展速度最快的公司。同时，OpenAI、阿里巴巴、谷歌和 Anthropic 都会做出令人敬佩的研究工作。

尽管字节跳动可能不在大多数人的视野里，但我会把它列在名单上。字节在大模型领域已经投入了海量资源。在前沿模型探索上敢于投入大量资金，其中一个最合理的逻辑是掌握了大量的用户，当所投入的巨额成本分摊到能获利的大体量用户平台时，商业模式就能够成立。基于字节跳动拥有最多的用户、最多元化的商业变现模式，我做了这个预测。

彭博社：百度是个让我印象深刻的公司，但不在你的名单上。此外，中国政府对 AI 的支持，有哪些变化？

李开复：我们都非常尊重并感谢百度在中国真正开启了 Transformer 革命。他们试图聘请杰弗里·辛顿，后来延揽了吴恩达。我认为这证明了李彦宏先生具有远见。

另一个关于政府支持的问题。中国政府的一个重点工作方向被称为“新质生产力”。这意味着利用高科技创造生产力、降本提效，并通过高新技术的引入，将所有传统行业转变为更具盈利能力和竞争力的行业，而 AI 正是其中的核心引擎。

彭博社：几周前的民企座谈会上，中国科技巨头的 CEO 们与国家领导人同处一室，这种情形很少见。从这个角度来看，你认为政府会有哪些具体的措施来支持这一目标？

李开复：我认为目前中国地方政府都在非常积极地拥抱 AI，各地都在探索如何将 AI 应用到当地的传统优势产业中，用技术打造“新质生产力”，进而促进城市 GDP 增长，这是一个从上到下都在贯彻落实的方向。对于地方政府来说，“新质生产力”是令人振奋的、非常有效的新增长点，零一万物和其他友商公司都开放和地方政府及产业展开紧密的合作探索。

原文链接：

https://www.bloomberg.com/news/articles/2025-03-20/ai-pioneer-sees-handful-of-models-surviving-us-china-shakeout

评论 3 条评论

发布

snow.zhang

腾讯既然不在，好奇是为什么？

2025-03-27 17:53 · 上海

 1 回复

Geek_27d4d8

他说的话不可信。

2025-03-26 14:32 · 河北

 1 回复

A Leap

说实话，现在看到这个人就烦，之前说只有大厂才能搞基础模型的是他，吹deepseek的也是他，如果没有真的洞见，可以不说话。

2025-03-26 10:25 · 四川

 2 回复

没有更多了

创作场景

李开复：超大模型预训练逐渐寡头化，国内将收敛至 DeepSeek、阿里、字节三家

填补 AI 圈还不存在的 Windows

“超大模型的预训练正在逐渐寡头化”

半导体技术封锁的影响

评论 3 条评论

2021新鲜面经，蚂蚁内部转岗Android面试分享，深夜思考

GitLab和Rainbond整合实现一体化开发环境

2021疫情下Android技术人的宅家学习进阶指南！花了大价钱大厂内部买来的学习资料，爱看不看

Anaconda详细安装及使用教程，阿里P8大牛亲自教你

2020这一年的Android面经汇总(百度、腾讯、滴滴，查漏补缺

2020阿里巴巴，字节跳动，京东，android驱动开发环境搭建

2021年尾 Android 面试之必问高级知识点（包含答案），kotlin语法大全

A010-menu资源，看完老板哭着让我留下来

Activity的生命周期，这可能是目前最全的

2021 Android 大厂面试（五）插件化，androidframework开发书籍

面试阿里P6，过关斩将直通2面，结果3面找了个架构师来吊打我？

分布式服务下，消息中间件改造

ajax分析学习(1)，android0基础

Andorid&Kotlin编译速度原理剖析（上），lambda表达式的作用与好处

2020面试题合集之吊打面试官系列（一），kotlin数组性能

2021牛转乾坤：新花样玩转Android组件化架构实践，15K-50K的详细Android学习指南

知识中台与区块链助力多源可信数据价值释放

Andriod 网络框架 OkHttp 源码解析，总结一下

大势已来！！区块链的真正价值是什么

Activity-的-36-大难点，你会几个？，android游戏开发实践指南

1.1 黑客与社会工程学

2020跳槽过后“带薪划水”偷刷阿里老哥的面经宝典，移动客户端开发框架

等保测评机构推荐证书有效期是多久？到期后怎么办？

最全Hadoop HDFS解析（一）

Activity的任务栈Task以及启动模式与Intent的Flag详解（经典博文，值得收藏

【云计算】什么是私有云？可提供哪些服务？缺点是什么？

2021Android面经，历时一个半月，斩获3个大厂offer，阿里P8大佬整理

2021京东 Android 岗 Java 面试真题解析，android平台架构的四个层次

巧用 Redis 数据结构实现亿级数据聚合统计

ajax分析学习，kotlin构造器

Andoird中LiveEventBus的使用——用LiveEventBus替代RxBus

创作场景

李开复：超大模型预训练逐渐寡头化，国内将收敛至 DeepSeek、阿里、字节三家

填补 AI 圈还不存在的 Windows

“超大模型的预训练正在逐渐寡头化”

半导体技术封锁的影响

评论 3 条评论

推荐阅读

电子书

大厂实战PPT下载