写点什么

OpenAI 又贵又“黑”,微软对供应商亮起“红灯”:曝出自研大模型,DeepSeek 或成救星?

  • 2025-03-11
    北京
  • 本文字数:3987 字

    阅读完需:约 13 分钟

大小:1.89M时长:10:59
OpenAI 又贵又“黑”,微软对供应商亮起“红灯”:曝出自研大模型,DeepSeek 或成救星?

整理 | 华卫、核子可乐


3 月 7 日,据外媒报道,微软正在筹谋没有 OpenAI 的新未来。微软 AI 部门负责人 Mustafa Suleyman 正将目光投向一个大胆的目标:减少公司对于 OpenAI 的依赖。目前,微软已经采取了一系列措施。值得注意的是,其背后的 AI 市场变化似乎更具警惕性:当模型供应商开始受制于售卖 token 的盈利模式、向下攫取应用层的价值,可能会发生什么?


微软决心“摆脱”OpenAI?


自 2019 年以来,微软已经向这家 AI 明星公司投入了超过 130 亿美元,但如今软件巨头希望夺回对自有模型及成本的掌控权。这事说起来简单——建立内部替代方案、削减开支,之后即可高枕无忧、运作如常。但现实情况则要复杂得多,“说起来容易做起来难”。


为此,微软在一年前聘请了作为谷歌 DeepMind 背后智囊之一的 Suleyman 领导其新成立的消费者 AI 部门 Microsoft AI。这一战略举措,也凸显出该软件巨头在 AI 领域的雄心壮志。


据外媒报道,“一位在场人士与另外两名听取了简报的微软员工透露,去年秋季在与 OpenAI 及微软高层领导的视频通话中,负责领导微软内部 AI 部门的 Suleyman 希望 OpenAI 方面能够解释其最新模型 o1 的工作原理。”但据称,OpenAI 拒绝了微软关于 o1 工作原理的技术细节的请求。


而这通发生在去年秋季的视频通话背后,其实是一场充满企业权力斗争与剑拔弩张氛围的对抗,而解释模型工作原理的要求被拒也成为改变两家公司关系走向的关键节点。


Suleyman 及其他微软高管之所以有此要求,当然也不仅仅是出自好奇。自联合创立的 Inflection AI 并于 2024 年 3 月正式加入微软以来,Suleyman 一直希望引导这位软件巨头走向既定的未来——即无论合作伙伴多么具有开创性,微软的 AI 雄心也不可单纯仰仗伙伴的支持。


首先自然是钱的问题。OpenAI 的模型(包括微软 Copilot 助手所依托的 GPT-4)运行起来并不便宜。将其运行在 Azure 云基础设施之上会产生大量成本,而微软自然渴望通过更精简的自有替代方案降低运营开销。


而早在 2024 年 12 月,路透社就曾报道称,微软公司开始将其自有大模型(如 Phi-4)集成至 Microsoft 365 Copilot 当中,旨在加快速度并降低成本。与 OpenAI 的合作确实利润丰厚(微软可以分得部分收入),但承受的压力也相当夸张。另据纽约时报报道,OpenAI 在 2024 年内预计亏损 50 亿美元,这也进一步增强了微软打造自有 AI 生态体系的愿望。


其次是战略方面的考量。此番在 X 上流传的帖子就表明,微软除了省钱之外,还希望开发出能够与 OpenAI 直接竞争、并有望单独被投放市场的 AI 推理模型。在 OpenAI 于 2023 年因 CEO 山姆 - 奥特曼突遭弹劾而几近崩溃之时,微软就已经下定了另起炉灶的决心。毕竟那起事件清楚表明,合作伙伴的内部混乱很可能在一夜之间拖垮微软的 AI 布局。


另值得一提的是,今年 1 月 OpenAI 与甲骨文牵手组建数据中心时,就有人怀疑微软同 OpenAI 之间的关系是否出现了裂痕。当时,OpenAI 的 CEO Sam Altman 还第一时间回应称,“绝对没有!这是一项非常重要且意义重大的长期合作关系。我们只是需要更多的算力。”


模型即产品,自己有才能有未来?


从上述几方面可见,“自主可控 AI”并不是微软一时的突发奇想。而事实上,不止微软,业内许多人士和公司都注意到并开始思考这一发展方向。


近日,一篇由 AI 科技公司 Pleias 的联合创始人 Alexander Doria 撰写的文章也提到了“手握 AI 模型主动权才有未来”的观点,并引发热议。该文的标题为《The Model is the Product》,其明确提出:所有投资者一直都在押注应用层。在人工智能进化的下一阶段,应用层很可能是最先被自动化和颠覆的。


Doria 认为,现在是时候这样说了:模型就是产品。目前,研究领域和市场发展方面的所有因素都朝着这个方向推进。


  • 通用型模型的扩展正陷入停滞。这正是 GPT-4.5 发布所传达的核心信息:模型的能力呈线性增长,而计算成本却呈几何级增长。即便在过去两年中在训练和基础设施方面取得了各种效率提升,OpenAI 也无法以相对可承受的价格部署这种巨型模型。

  • 带倾向性的训练效果比预期好得多。强化学习与推理相结合意味着模型突然能够学习任务了。这既不是传统的机器学习,也不是基础模型的运作方式,而是一种神秘的 “第三种方式”。甚至一些小型模型也突然在数学方面表现得极为出色。编程模型不再仅仅是生成代码,而是能够自行管理整个代码库。还有 Claude 模型在上下文信息非常有限且没有专门训练的情况下就能玩《精灵宝可梦》游戏。

  • 推理成本正在急剧下降。DeepSeek 的最新优化成果表明,现有的所有 GPU 能够满足前沿模型每天处理 1 万个 token 的需求,而这足以覆盖全球人口的需求。但实际上并不存在如此高的需求水平。对于模型供应商来说,靠售卖 token 来盈利的商业模式已经行不通了:他们必须向价值链的更高端迈进。


而在过去几周中,我们也已经看到了新一代模型作为产品的两个典型示例:OpenAI 的 DeepResearch 和 Claude Sonnet 3.7。


对于目前在大型实验室工作的人来说,一个显而易见的事实是,自主系统的所有重大进展首先将来自于对模型的重新设计。但在这个过程中,大部分价值现在是由模型训练者创造的,而且很可能最终也由模型训练者获取。所带来的商业影响也极其明显,数据平台公司 Databricks 的 Gen AI 副总裁 Naveen Rao 对此阐述得很到位:


在未来两到三年内,所有的封闭式人工智能模型供应商都将停止销售应用程序编程接口(API)。只有开源模型会通过 API 提供,封闭式模型供应商正试图构建非商品化的能力,而且他们需要出色的用户界面(UI)来交付这些能力。这不再仅仅是一个模型了,而是一个带有特定用途 UI 的应用程序。


所以,模型供应商和模型集成公司之间的蜜月期已经结束了。简而言之,现在大多数模型集成公司面临的困境是:要么自己进行模型训练,要么只能依赖于别人训练的模型。他们目前所做的一切,既是在为大型实验室进行免费的市场调研,而且由于所有的输出最终都是通过模型供应商生成的,所以甚至还相当于在为其进行免费的数据设计和生成。


至于之后会发生什么,那就很难说了。成功的模型集成公司确实有一个优势,那就是他们非常了解自己所处的垂直领域,并且积累了大量宝贵的用户反馈。


然而,Doria 表示,根据其经验来看,从模型层向下发展到应用层,要比从零开始构建全新的模型训练能力更容易。而且,这些模型集成公司可能也没有从他们的投资者那里得到什么助力。据他听到的消息,投资者们对模型训练存在着严重的负面偏见,以至于这些公司几乎不得不隐瞒他们最关键的价值:目前无论是 Cursor Small 还是 Codium 都没有得到妥善的记录和说明。


Doria 提及了 DeepSeek 的例子:它不仅把模型当作一种产品,而是将其视为一个通用的基础设施层。梁文锋曾这样叙述其计划:


我们认为,当前阶段是技术创新的爆发期,而非应用的爆发期。如果形成了一个完整的上下游产业生态系统,那么我们就无需自己开发应用了。当然,如果有需要,我们开发应用也没有障碍,但研究和技术创新将始终是我们的首要任务。


在 Doria 看来,现在只专注于应用的开发,就好比 “安排上次战争的将领去打下一次战争”。恐怕许多人甚至都没有意识到,上次的“战争”已经结束了。


短时间内难以解绑?


长期以来,微软和 OpenAI 保持着密切关系。OpenAI 的技术几乎被全面嵌入至微软产品线当中,包括 Copilot 及 Bing 的 AI 搜索功能,乃至 Microsoft 365 生产力工具。今年 1 月,双方又对合作协议做出了调整,允许 OpenAI 同甲骨文等其他云服务商合作,但条件是微软仍可在 2030 年之前将 OpenAI 模型用于自家产品的独家授权。也就是说,双方的合作协议将持续到 2030 年,这样的授权周期可谓相当漫长。


但据外媒报道,微软一直在加大人工智能方面的投入,开发自家人工智能模型的同时,还在探索为微软 Copilot 等产品提供 AI 支持的替代品。上个月,微软将 OpenAI 的 o1 推理模型纳入自家 Copilot 产品。


有知情人士在今天透露,微软已经创建了内部 AI 模型,并表示其打造的这批大模型名为 MAI 系列,测试内容则涵盖多种任务类型,包括为该公司的 Copilot AI 助手提供支持。这位不愿透露姓名的知情人士提到,微软正在开发的一系列模型已经通过基准测试,从结果来看性能已经不逊于包括 OpenAI 和 Anthropic 在内的最先进竞争对手。


根据这位知情人士的说法,微软亦在开发自己的 AI“推理”模型,可与 OpenAI 的 o1 和 o3-mini 等模型相媲美。另报道称,MAI 系列模型比微软早期发布的 Phi 模型大得多。微软正在探索在今年晚些时候将 MAI 模型作为 API 提供的可能性,这将允许开发人员将其集成到自己的应用程序中。


与此同时,据说微软正在测试 xAI、Meta、Anthropic 和 DeepSeek 等厂商的 AI 模型,以替代 OpenAI 技术。微软公司发言人也曾公开表示,“如我们之前提到,我们正在使用多种模型,其中既包括继续与 OpenAI 保持深度合作的产物,也有来自 Microsoft AI 的模型与其他开源模型。”


对此,如今业内的讨论反映出人们既怀疑又好奇的复杂情绪。一些人质疑,考虑到 OpenAI 的技术已经在微软生态系统之内深度绑定,微软是否真的能够摆脱对它的依赖,其可能遭遇到技术障碍、内部阻力及其他现实挑战。还有人提到,“微软持有 OpenAI 49% 的股份,他们不会为了 1% 的性能提升放弃 ChatGPT 转而使用其他模型。”也有网友吃瓜道:“OpenAI 不再有创新了吗?”


当然,如果微软能够成功做到这一点,好处也将显而易见:借助实现成本更低、速度更快的 AI 服务,顺利在竞争激烈的市场当中占据一席之地。但考虑到合同义务、技术依赖性以及 OpenAI 的持续创新等影响因素,Suleyman 的这项使命更像是一段长期磨练,绝非短时间内可以达成。


参考链接:


https://techstartups.com/2025/03/07/microsoft-is-plotting-a-future-without-openai/


https://fortune.com/2025/03/07/microsoft-creates-in-house-ai-models-it-believes-rival-openais/


https://vintagedata.org/blog/posts/model-is-the-product


2025-03-11 10:184422

评论

发布
暂无评论

TiDBv6.5离线部署

TiDB 社区干货传送门

6.x 实践

手机一开,说办就办!指尖上的“数字江西”

OceanBase 数据库

数据库 oceanbase

堡垒机免费版有哪些功能啊?后面需要过等保怎么办?

行云管家

安全运维 运维软件 免费运维

网闸、防火墙、堡垒机三大定义说明

行云管家

防火墙 堡垒机 网闸

3D LED显示屏选购指南

Dylan

3D LED显示屏 避坑指南

杜绝开源依赖风险,许可证扫描让高效&合规「两不误」

极狐GitLab

DevOps DevSecOps 开源许可证 极狐GitLab 安全合规

面试进阶齐飞!Github一天万赞的阿里Java系统性能优化有多牛?

Java你猿哥

Java JVM ssm Java性能优化

阻抗板是否高可靠,华秋有话说

华秋电子

深度解析 slab 内存池回收内存以及销毁全流程

bin的技术小屋

Linux 内存管理 Linux Kenel 内存池 slab

软件测试/测试开发丨Web自动化测试中显式等待的高级使用

测试人

程序员 软件测试 自动化测试 测试开发

官宣!时序数据库 TDengine 与天翼云完成产品兼容性认证

爱倒腾的程序员

涛思数据 时序数据库 ​TDengine

TiDB x Flink x Iceberg 实时 ODS 实践

TiDB 社区干货传送门

实践案例 大数据场景实践 实时数仓场景实践 数据中台场景实践 OLAP 场景实践

详解GaussDB(DWS)用户监控原理及应用

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

产品经理们,请小心这 5 种错误的职场打开方式!

LigaAI

产品经理 团队协作 研发协作 产品负责人 企业号 5 月 PK 榜

Bytebase:更好地管理你的 OceanBase 数据库

OceanBase 数据库

数据库 oceanbase

7个工程应用中数据库性能优化经验分享

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

JVM——解析运行期优化与JIT编译器

Java你猿哥

JVM ssm 虚拟机 编译器 JIT编译器

GitHub上标星75k+超牛的《Java面试突击离线版》够你润进去了

程序知音

Java java面试 Java进阶 Java面试题 Java面试八股文

深度学习进阶篇-预训练模型[3]:XLNet、BERT、GPT,ELMO的区别优缺点,模型框架、一些Trick、Transformer Encoder等原理详细讲解

汀丶人工智能

自然语言处理 深度学习 预训练模型 Transformer GPT

数据可视化:相关类可视化图表大全

2D3D前端可视化开发

数据可视化控件 数据可视化工具 可视化数据 可视化图表 数据可视化设计

揭秘百度IM消息中台的全量用户消息推送技术改造实践

JackJiang

消息推送 即时通讯IM im开发

C4D 常用 14 款插件

Finovy Cloud

C4D 3D软件

基于openfaas托管脚本的实践

百度Geek说

数据库 百度 企业号 5 月 PK 榜

Github标星78k,Alibaba最新发布的Spring Boot项目实战文档!太强了

Java你猿哥

Java 面试 Spring Boot ssm Spring MVC

TiDB 使用国内公有云和私有部署的 S3 存储备份指南

TiDB 社区干货传送门

数据库架构设计 6.x 实践

性能测试监控指标及分析调优 | 京东云技术团队

京东科技开发者

性能优化 性能测试 企业号 5 月 PK 榜 测试监控

MobPush iOS端合规指南

MobTech袤博科技

TiDB x Flink 数据集成实践

TiDB 社区干货传送门

实践案例 大数据场景实践 数据中台场景实践 OLAP 场景实践

生态伙伴 | 携手深圳科创学院,持续推动项目落地与成长

华秋电子

AI 换脸技术:你的照片可能被滥用了!

郑州埃文科技

AI 数据治理

微服务是不是金科玉律?基于Spring Cloud如何构建分布式系统?

做梦都在改BUG

Java 架构 微服务 Spring Cloud

OpenAI 又贵又“黑”,微软对供应商亮起“红灯”:曝出自研大模型,DeepSeek 或成救星?_AI&大模型_华卫_InfoQ精选文章