AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

李开复:超大模型预训练逐渐寡头化,国内将收敛至 DeepSeek、阿里、字节三家

  • 2025-03-25
    北京
  • 本文字数:4262 字

    阅读完需:约 14 分钟

大小:2.01M时长:11:42
李开复:超大模型预训练逐渐寡头化,国内将收敛至 DeepSeek、阿里、字节三家

3 月 20 日,零一万物 CEO、创新工场董事长李开复博士接受了彭博社的专访。

 

在访谈中他表示,DeepSeek 爆红出圈给整个中国大模型行业完成了实质意义上的市场认知教育,随着模型性能的提升与推理成本的下降,2025 年 AI-First B 端、C 端应用都将迎来爆发。另一方面,各地政府也对大模型展现出浓厚的兴趣,都在积极探索如何将 AI 应用到当地优势传统产业中,用产业大模型打造“新质生产力”,进而促进实体经济的增长。

 

李开复博士以 Windows 内核类比:DeepSeek 是 Windows 内核,而零一万物提供的平台则是 Windows 操作系统、应用程序、UI 界面。没有 Windows 操作系统、应用程序、UI 界面,Windows 内核就无法发挥真正的价值。要真正发挥大模型的价值所在,AI 领域内仍然没有出现自己的“ Windows 操作系统”,零一万物想要做的正是填补这一空缺。

 

谈及大模型领域未来的竞争格局,李开复博士认为,在中美两国超大模型的预训练都在逐渐寡头化,并且寡头化的程度在不断加大。他预测中国大模型领域未来将会收敛至 DeepSeek、阿里巴巴、字节跳动三家,其中以 DeepSeek 势头最猛;美国则以 xAI 的发展势头最为迅速,但 OpenAI、Anthropic、Google 也都会做出令人敬佩的研发工作。

 

至于中美之间的 AI 竞赛,李开复博士认为在印证了“需求是创新之母”的同时,DeepSeek 的突破也使得开源模式呈现出压倒性的优势,坚持闭源策略的 OpenAI、Anthropic 等公司,都会面临更大的压力。

 

今年零一万物做的最大的调整是:不再执着于只推 Yi 模型,采取“开放模型”的策略。此前,零一万物 COO  Anita(黄蕙雯)明确表示不会再做万亿以上超大参数模型,“因为我们做不起。”零一现阶段最关注的是能否真正把 AI 推到市场上,让市场不只歌颂 AI,而是真正能用上 AI。

 

李开复分析,零一做 ToB 产品的优势在于积淀。零一有完整的软硬结合的解决方案,在如何微调、如何对应数据库、如何做机器训练和数据配比上的经验丰富。下面为李开复博士对话全文。

 

填补 AI 圈还不存在的 Windows

 

彭博社:今年可谓是人工智能真正渗透各行业的元年,此次我们特邀零一万物 CEO、创新工场董事长李开复博士来深入探讨这一话题。今天也是一个绝佳的时机来和您一起讨论,因为零一万物刚刚对外发布了“万智企业大模型一站式平台”,首发能帮助企业更广泛地部署、应用 DeepSeek 模型的解决方案。能不能请您详细介绍一下这项业务?

 

李开复:当 DeepSeek 问世的时候,中国迎来了自己的“ChatGPT 时刻”,我们可以称之为“DeepSeek 时刻”。在中国春节假期期间,几乎每个人都在谈论 DeepSeek,许多企业的 CEO 们节后返工马上要求在自己的公司里用上 DeepSeek。他们发现,DeepSeek 是一个非常出色的模型, AI 的表现令人惊叹,但它不能直接赋能公司里面的人力资源、财务和客服等场景,因为开源模型还缺少连接企业数据库、应用程序等必要的中间件。

 

零一万物认同 DeepSeek 所取得的巨大进步,我们决定全力支持 DeepSeek,让它更好用。我们补充了那些缺失的中间件,开发了易用的使用界面,使 DeepSeek 在企业中变得可用。这就是零一万物于本周一发布的产品——万智企业大模型一站式平台,它在中国大陆和香港地区的初期反响相当不错。

 

彭博社:这款“万智”新平台背后的考量是怎样的?

 

李开复:许多人现在都下载了 DeepSeek,也很喜欢使用 DeepSeek。我有一个 CEO 朋友问他的员工:你们都用 DeepSeek 做什么,得到的答案是算命。这是很有意思的用法,你们或许都可以试一试,但目前的 DeepSeek 还无法直接深入到企业级应用里去。

 

每个企业都有 ERP 和 CRM 数据库,有员工数据等各种分门别类的企业内部信息,企业需要的是具备行业纵深的知识型模型。比如彭博社会希望有一个金融知识渊博的模型,平安保险集团会希望有一个保险专业知识的模型。零一万物发布的平台,就是为了满足这类各行各业的企业级需求。

 

这就像是如果我交给你 Windows 内核,你可能不知道如何把它用起来,你会需要 Windows 软件操作系统和应用程序界面,还有配套的 Windows 系列应用,Windows 内核才能变得有用。零一万物推出新的万智企业大模型一站式平台,就像是在为 Windows 内核构建可视化界面和操作中台,让 DeepSeek 的基座模型高效便捷地转化为有效的生产力工具。

 

“超大模型的预训练正在逐渐寡头化”

 

彭博社:选择 DeepSeek 作为底层架构而非美国模型,是否折射出中美 AI 竞赛格局变化?

 

李开复:在中美,超大模型的预训练正在逐渐寡头化,并且寡头化的程度在不断加大。虽然未必所有人都认同,但我们的确同时看到开源圈展现出压倒性的优势,OpenAI 和 Anthropic 都相信自己还能训练出远超其他玩家的闭源模型。当他们看到一个性能相近的开源模型时,我想他们可能受到了沉重的打击。OpenAI 在 2024 年的运营成本为 70 亿美元,而 DeepSeek 的运营成本可能只有 OpenAI 的 2%。

 

各家的模型都很优秀,问题不在于哪家模型性能高出 1%,而是 OpenAI 成本高昂的模型路线是否具有可持续性。OpenAI 每年花费 70 亿美元,面临着巨额亏损。但现在出现了一个竞争对手,将成本低廉数倍的开源模型免费开放给市场,且这个竞争对手资源充沛,目前看来 DeepSeek 有足够的资金储备持续投入模型研发,并已经有效地将计算成本降低了五到十倍。有了这样一个强大的竞争对手,我认为 OpenAI 的萨姆·奥尔特曼可能夜里辗转难眠。

 

彭博社:那么,你认为 DeepSeek 真的挑战了现有 AI 的商业逻辑吗?另外,无论是在美国还是在中国,AI 的商业落地已经相当规模化。在开源模式占据优势的当下来看,你认为中国市场未来会跑出多少个 AI 大模型?

 

李开复:我认为很大概率会收拢到三家,DeepSeek、阿里巴巴和字节跳动。他们的模型会随着时间不断迭代进化。

 

彭博社:这份名单上少了一些公司的名字。

 

李开复:当然,还会有许多其他公司希望构建他们自己的模型,我们也会拭目以待看是否会有第四、第五个玩家。但即使在这三个中,我看好 DeepSeek 目前最具势头,这也是我们基于它推出新产品的原因。

 

但我也想指出,关于你问到 AI 模型商品化的问题,我不认为今天的 AI 已经商品化了。我认为,吸纳大量资金训练的基座模型开始趋近同质化,它们成本高昂、越来越难和开源技术竞争,但人工智能技术并没有商品化。

 

就像 Windows 内核、Linux 内核这些已经比较商品化,但 Windows 软件系统并没有商品化,微软多年还靠此赚了很多钱。零一万物想要做的是填补 AI 圈还不存在的 Windows,并使用 DeepSeek 作为我们类 Windows 的内核之一。

 

彭博社:那么,你认为现在的 AI 增加了什么价值?对于投资人来说,在思考这个行业的价值增长点时,具体有哪些主要的经济因素?而为什么你认为只有三个玩家的空间?

 

李开复:的确可能还有第四、第五个,但在多数市场中,大部分的终局最后将以寡头局面收场。第一名赚了很多钱,第二名收支平衡,后头几名多半不能算是成功。在大模型的赛道中,由于底层模型很难直接转化为商业模式,所以情况更加复杂。但一旦你是最终赢家,就有许多方法可以变现。近期我们可以看到的变化是,中美两地的投资人几乎不再下注更多更贵的底层模型公司。他们更愿意投资 AI 应用、消费者应用、AI 基础设施类型的创新企业,还有企业应用的广大市场需求,未来每个应用、千行百业都会被 AI 重塑,这些应用能为企业提供真正的价值。所以,AI 相关的资本正转往这些方向,而不再投入基座模型。

 

半导体技术封锁的影响

 

彭博社:半导体技术封锁是否会成为制约中国 AI 发展的一个限制因素?

 

李开复:我们可以回顾过去来理解这个问题。过去,中国总是能够在底层技术方面迎头赶上,并构建出伟大的工程产品,而美国更擅长取得前沿突破。我曾经在《AI 未来》这本书中深入论述这点,这种情况目前来看仍在继续。

 

如今我们看到 DeepSeek 展现出了极强的适应性和竞争力,再次证明了“需求是创新之母”这一观点。因为他们拥有比美国大厂少很多的 GPU,所以不得不设法把已有 GPU 的效率提高 10 倍。正因为 DeepSeek 拥有计算资源比美国大厂少了几个数量级的,反而被迫更加精益求精,倒逼出的技术创新使得他们的模型训练和推理成本比 OpenAI 和其他公司低五到十倍,让全球刮目相看。

 

彭博社:大约几个月前,在 2024 年的 10 月份我们曾经有过一次交流,当时零一万物也推出了与 DeepSeek 相似的模型,并且早于 DeepSeek 发布 V3 之前。您如何看待模型迭代的频率?这种频率是被什么因素主导?DeepSeek 的成功是一种趋势使然,还是产品本身的魅力?今年,大模型行业又会给我们什么样的惊喜?

 

李开复:中国大模型行业的竞争仍会热火朝天好一段时间,最终可能有三个赢家,美国可能有四个赢家,但这并不意味着其他几十家公司会放弃竞争,所以我判断那些正在快速发展壮大的公司会继续高频发布新的模型和产品。在我看来,xAI、DeepSeek 是发展速度最快的公司。同时,OpenAI、阿里巴巴、谷歌和 Anthropic 都会做出令人敬佩的研究工作。

 

尽管字节跳动可能不在大多数人的视野里,但我会把它列在名单上。字节在大模型领域已经投入了海量资源。在前沿模型探索上敢于投入大量资金,其中一个最合理的逻辑是掌握了大量的用户,当所投入的巨额成本分摊到能获利的大体量用户平台时,商业模式就能够成立。基于字节跳动拥有最多的用户、最多元化的商业变现模式,我做了这个预测。

 

彭博社:百度是个让我印象深刻的公司,但不在你的名单上。此外,中国政府对 AI 的支持,有哪些变化?

 

李开复:我们都非常尊重并感谢百度在中国真正开启了 Transformer 革命。他们试图聘请杰弗里·辛顿,后来延揽了吴恩达。我认为这证明了李彦宏先生具有远见。

 

另一个关于政府支持的问题。中国政府的一个重点工作方向被称为“新质生产力”。这意味着利用高科技创造生产力、降本提效,并通过高新技术的引入,将所有传统行业转变为更具盈利能力和竞争力的行业,而 AI 正是其中的核心引擎。

 

彭博社:几周前的民企座谈会上,中国科技巨头的 CEO 们与国家领导人同处一室,这种情形很少见。从这个角度来看,你认为政府会有哪些具体的措施来支持这一目标?

 

李开复:我认为目前中国地方政府都在非常积极地拥抱 AI,各地都在探索如何将 AI 应用到当地的传统优势产业中,用技术打造“新质生产力”,进而促进城市 GDP 增长,这是一个从上到下都在贯彻落实的方向。对于地方政府来说,“新质生产力”是令人振奋的、非常有效的新增长点,零一万物和其他友商公司都开放和地方政府及产业展开紧密的合作探索。

 

原文链接:

https://www.bloomberg.com/news/articles/2025-03-20/ai-pioneer-sees-handful-of-models-surviving-us-china-shakeout

 

2025-03-25 15:495306

评论 3 条评论

发布
用户头像
腾讯既然不在,好奇是为什么?
2025-03-27 17:53 · 上海
回复
用户头像
他说的话不可信。
2025-03-26 14:32 · 河北
回复
用户头像
说实话,现在看到这个人就烦,之前说只有大厂才能搞基础模型的是他,吹deepseek的也是他,如果没有真的洞见,可以不说话。
2025-03-26 10:25 · 四川
回复
没有更多了

2022年最新数据库经典面试题及答案汇总(含PostgreSQL、Oracle、MySQL)

墨天轮

MySQL 数据库 oracle postgresql 面试题

WhaleDI自助建模实践与探索

鲸品堂

AI Codec 建模

2022年汽车品牌智能网联竞争力指数(ICVCI)

易观分析

汽车 ICVCI 智能网联

SSH的工作原理、加密方式以及配置多个ssh key

甜点cc

前端 学习笔记 加密 SSH 10月月更

精盾信息莅临千锋教育武汉校区招聘前端开发工程师

千锋IT教育

安全可控的企业级低代码开发平台

力软低代码开发平台

浅谈Python中的生成器

何极光

Python 生成器 10月月更

浅谈 Python 中的迭代器

何极光

Python 迭代器 10月月更

重磅,无需特殊工具,直接访问网站!

八点半的Bruce.D

如何让 SAP Spartacus 访问 navigation node 的上下文,暴露更多的字段

阿英

typescript angular SAP Spartacus 10月月更

使用Docker部署软件运行环境

源字节1号

软件开发 前端开发 后端开发 小程序开发

阿里云注册集群+Prometheus 解决多云容器集群运维痛点

阿里巴巴云原生

阿里云 云原生 Grafana Prometheus

【FAQ】关于华为地图服务定位存在偏差的原因及解决办法

HarmonyOS SDK

地图

千锋武汉分校前端学员走访英志软件,并开展现场面试

千锋IT教育

找个好用的录屏软件,怎么这么难?

淋雨

Camtasia

学C++的以后都能从事哪些岗位?

C++后台开发

c++ 后端开发 客户端开发 linux开发 C++开发

面向复杂业务场景下的低代码平台组件设计与实践分享

Baidu AICLOUD

组件化 低代码开发平台 数据映射

OneFlow源码解析:Global Tensor

OneFlow

人工智能 深度学习 源码解析

云原生时代的应用端到端可观测体系如何构建?

嘉为蓝鲸

运维 监控 可观测性 告警

嘉为蓝鲸可观测性产品获Gartner Toolkit 推荐

嘉为蓝鲸

运维 监控 Gartner 可观测

Zepoch已售出500+,Zebec Chain受到市场追捧

西柚子

TOGAF认证考试开启“主线+支线+副本”模式!

涛哥 数字产品和业务架构

Spring Boot「18」使用 JDBC 连接数据库

Samson

Java spring 学习笔记 spring-boot 10月月更

千锋教育走访人才合作企业数式科技 深度了解企业人才需求

千锋IT教育

澜舟科技推出【熊猫小说家】小程序,用 AI 书写你的故事

澜舟孟子开源社区

人工智能 nlp AIGC

Sanitizers 系列之 address sanitizer 原理篇

网易云信

数据库 算法 系统

敢承诺安全效果?IT人竟能如此省心

科技热闻

LED显示屏安装之前要注意的问题

Dylan

LED显示屏 户外LED显示屏 led显示屏厂家

一文浅析人工智能领域相关概念之间的关系

九章云极DataCanvas

人工智能 神经网络 机器学习

Go语言入门10—Map

良猿

Go golang 后端 Go web

实时数据湖 Flink Hudi 实践探索

阿里云大数据AI技术

大数据 flink 企业号十月 PK 榜

李开复:超大模型预训练逐渐寡头化,国内将收敛至 DeepSeek、阿里、字节三家_AI&大模型_褚杏娟_InfoQ精选文章