写点什么

十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o 系列合并,非思维链模型到头!

  • 2025-02-13
    北京
  • 本文字数:3035 字

    阅读完需:约 10 分钟

大小:1.45M时长:08:26
十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o系列合并,非思维链模型到头!

整理 |华卫、核子可乐


今天一大早(2 月 13 日),OpenAI CEO 萨姆·奥特曼 (Sam Altman) 突然公开放出该公司最新的 AI 模型路线图,预告了 GPT-4.5 和 GPT-5 的未来规划。奥特曼表示,OpenAI 将在不久后推出 GPT-5 模型,该模型将在 ChatGPT 和 API 中整合多项 OpenAI 技术。GPT-5 推出之前,OpenAI 计划先发布其最后一个“非思维链模型”GPT-4.5(内部称之为 Orion )。


在被询问 GPT-4.5 和 GPT-5 模型的预计发布时间时,奥特曼虽然没有给出具体日期,但回复了这样的时间框架:“周 / 月”。也就是说,或预计几周内会推出 GPT - 4.5,几个月内会推出 GPT - 5。所以,GPT-5 很有可能在今年问世。



值得注意的是,除介绍产品路线图外,奥特曼还谈到了 ChatGPT 现在令人困惑的界面设计,即强迫用户在不同模型版本中做出选择以完成不同任务。OpenAI 正试图简化模型选择,在此之后,他们的首要目标是通过创建可以使用其所有工具、知道何时长时间思考或不长时间思考并且通常对非常广泛的任务有用的系统来统一 o 系列模型和 GPT 系列模型。


奥特曼在 “更新版路线图” 指出,去年 12 月高调亮相的 o3 推理模型,不会按原计划独立发布,而是会整合到 GPT - 5 中。o3 于去年 12 月首次亮相。在 Frontier Math(一项包含特别困难的数学问题的基准)上创下了 25.2% 的记录,上个月该公司还推出了由 o3 提供支持、可以独立进行深入网络研究、数据分析和报告编写等任务的 Deep Research。


不过,据 OpenAI 开发人员体验主管 Romain Huet 透露,其 API 依然支持 o3 推理功能。Huet 称,“我们将继续提供用户需要的所有控制功能,例如‘推理力度’设置,这样用户就可以直接从一个 GPT-5 系统中使用所有功能和工具。敬请期待!”



OpenAI 产品规划大变


根据奥特曼的说法,OpenAI 的产品阵容已经变得复杂,并表示该公司希望在简化产品方面 “做得更好” 。他在帖子中回应乔布斯的著名口号道:“我们希望人工智能能为你‘顺利运行’,也意识到目前 OpenAI 的模型和产品线已经变得太过复杂。我们和你们一样讨厌模型选择器,希望回归到那种神奇的统一智能状态。”


其字里行间透露出:ChatGPT 对用户来说有点像“迷宫”,他们必须从几个名称易混淆的人工智能模型中选择由哪个来回答自己的问题。事实也的确如此,用户面临的挑战是弄清楚要从哪种类型的模型开始使用:是大型语言 GPT 系列模型和推理 o 系列模型中的哪一个。OpenAI 也面临确定哪种类型的模型能够提供用户所需响应的挑战,当然这是 OpenAI 接下来要解决的问题。


与之形成对比的是当前大火的 DeepSeek,仅凭一款语言模型 V3 和一款推理模型 R1 便斩获一众用户。


而 ChatGPT 的复杂性主要归咎于产品发布速度过快,不同模型在性能、推理能力和计算要求方面进行了权衡。OpenAI 目前提供多种多样(在有些人眼中则是令人困惑)的模型组合,其中 GPT 代表语言型大模型,最早于 2018 年推出,从 GPT-1 一直迭代到现在的 GPT-4 系列;“o”系列代表推理模型,第一代于去年 9 月推出,三个月后又发布了新一代的 o3;“Dall-e”为图像生成模型,“Sora”为视频生成模型,“GPT-Vision”则属于视觉理解模型。



对于 Plus 用户,ChatGPT 应用程序目前包括这些型号选项和说明:


  • GPT-4o:适用于大多数问题

  • 带计划任务的 GPT-4o:要求 ChatGPT 稍后跟进

  • o1:使用高级推理

  • o3-mini:快速进行高级推理

  • o3-mini-high:擅长编码和逻辑

  • GPT-4o mini:大多数问题速度更快

  • GPT-4:传统模型


如何解决?就是回归奥特曼所谓“神奇的统一智能”。OpenAI 计划统一其人工智能模型,把各种文本模型(包括神秘的 o 系列与 GPT 系列)合并为能够处理从休闲聊天到复杂分析等各类需求的单一系统,用户不必在 ChatGPT 界面上专门为当前任务选择运行哪种 GPT。


真正的转折点将出现在 GPT-5 身上,它应该会整合 OpenAI 麾下所有技术。据奥特曼介绍,GPT-5 的设计更加通用、智能和用户友好,主要目标之一是消除在不同人工智能模型之间切换的复杂性,并创建一个能高效处理各种任务的系统。


因此,听起来 OpenAI 想要的是一个总括性的人工智能,它足够聪明,可以根据任务来选择运行哪些 GPT 模型。但这一变化也可能会让人怀疑,ChatGPT 是在利用其最强大的人工智能模型,还是在使用较老的技术。此前就有消息人士称,GPT-4.5 在输出质量方面的改进“远小于”其前身 GPT-4 在发布时提供的质量。


此番调整还意味着,OpenAI 未来将不会继续以独立产品的形式继续发布推理 / 编码模型(包括目前已经发布的 o3 模型),而是将其功能统一整合到 GPT-5 系统当中。对于使用 OpenAI API 的开发人员来说,这样的集成过程将更加简单——他们不必在不同模型间做出选择,而可以直接访问具备多种任务处理能力的单一系统。


然而,这种尝试也可能适得其反,因为肯定有某些用例需要明确搭配算力消耗更少、单 token 价格更低的模型才能保持利润空间。OpenAI 并未详细说明此举将对 API 成本造成何种影响。但奥特曼坚信这番调整将物有所值,并预计 GPT-5 的能力将极其强大,还在最近于柏林进行的一次讨论中搞了波宣传。他强调称,“我认为人类已经很难说比 GPT-5 更聪明了。”


一大波免费用户福利


这些发展正值 OpenAI 在人工智能领域的主导地位面临日益激烈的竞争之际,几周前,中国的 DeepSeek 凭借其强大且低成本的开源模型让 OpenAI 和整个 AI 世界都措手不及。毫无疑问,OpenAI 感受到了 DeepSeek 这股新晋开源竞争势力带来的威胁。


在过去一年中,OpenAI 在免费版和 20 美元 / 月的 Plus 版之上推出了新的 ChatGPT 订阅层级,即每月 200 美元的 ChatGPT Pro。除此之外,该公司还发布了 Operator 智能体、Deep Research、ChatGPT 任务和许多其他新功能,但这些功能有时只能通过特定模型或付费级别获得。


此次,OpenAI 宣布将通过 ChatGPT 免费套餐开放集成各项功能的 GPT-5。奥特曼详细介绍了 ChatGPT 中 GPT-5 的分级访问系统:免费用户将以 “标准智能设置 ”获得无限聊天权限,但需遵守反滥用限制,而 Plus 用户将以增强智能级别访问 GPT-5,专业版用户将受益于更强的最高智能级别,包括语音、绘图、搜索、Deep Research 等更多功能。


消息一出,有用户称,“刚刚取消了 Open AI 的付费版本。”但也有氪金系用户表示,“我喜欢模型选择。有时,我想扔 0.01 美元去解决一个问题,无需等待;有时,我想扔 1 美元去解决它,然后等待。”


紧随其后,OpenAI 官方这边也发布一连串更新:所有 Pro 用户在所有 ChatGPT 终端 / 网页端,皆可体验 Deep Reasearch;o1 和 o3-mini 现支持在 ChatGPT 中上传文件和图片;o3-mini-high 的限额暴涨了 7 倍,Plus 用户每天最多可使用 50 次。



昨日,奥特曼还宣布,免费用户也将能够体验 Deep Reasearch 了,每个月 2 次;Plus 用户每月 10 次。奥特曼表示,自己对一些用户每天希望进行数十次深入研究需求感到震惊,未来会找到一种方法,让大家灵活支付想要的计算资源。有网友不禁感叹,“想想 openAI 最初是个非营利组织”、“真正的 AGI 会收取多少费用?”


总之接下来 OpenAI 发布的重要模型将受到 AI 行业的密切关注,许多人都想知道,该公司在大规模扩展大语言模型方面持续投入的巨额资金取得了怎样的成效。


参考链接:


https://www.techmeme.com/250212/p35#a250212p35


https://siliconangle.com/2025/02/12/openai-launch-gpt-5-matter-months-gpt-4-5-within-weeks/


https://decrypt.co/305681/openai-ceo-sam-altman-shares-new-gpt-5-roadmap


https://www.pcmag.com/news/with-deepseek-hot-on-its-heels-openai-teases-gpt-45-gpt-5-launch


2025-02-13 14:4910967

评论

发布
暂无评论

web前端培训如何使用CSS自定义属性实现骨架屏

@零度

CSS 前端开发

【福利活动】给你的代码叠个 Buff!点击“茶”收好礼

亚马逊云科技 (Amazon Web Services)

Lambda Code

【C语言】进阶指针night

謓泽

7月月更

浅谈 Slack Channel 支持的一些提高工作效率的特性

汪子熙

远程办公 即时通讯 SAP Slack 7月月更

软件研发效能需求价值流分析专题

思码逸研发效能

研发效能 软件研发

RocketMQ系列一:入门级使用演示

hum建应用专家

云计算 RocketMQ

龙蜥社区招募推广大使&体验官啦!| 人人都可以参与开源

OpenAnolis小助手

开源 龙蜥社区 社区建设 官网 体验官

想要白嫖正则是吧?这一次给你个够!

掘金安东尼

前端 正则 7月月更

服务网格中 sidecar 流量治理与多协议嗅探

博文视点Broadview

Room:又要写业务代码了?看看我吧,给你飞一般的感觉!

编程的平行世界

数据库 Android; android jetpack

CRMEB Pro v1.4,让用户体验更出彩!

CRMEB

JAVA编程规范之集合处理

源字节1号

软件开发 后端开发

python 中Mixin混入类的用法

杨彦星

Python

许式伟:Go+ 演进之路

七牛云

golang 编程语言 go+

Android/Unity大乱斗-完整双方集成交互指南

芝麻粒儿

android Unity 7月月更

Python 入门指南之交互式输入行编辑历史回溯

海拥(haiyong.site)

Python 7月月更

LeetCode-111. 二叉树的最小深度(java)

bug菌

Leet Code 7月月更

java零基础入门-综合案例(File类+递归)

喵手

7月月更

对接企业微信,客户关系管理也可以很简单!

CRMEB

DBPack 读写分离功能发布公告

峨嵋闲散人

分布式事务 分库分表 读写分离 dbmesh Database Mesh

有证书有目录!|海泰密码服务平台

电子信息发烧客

微信内H5页面唤起小程序&App

南城FE

前端 微信开发 7月月更

爱奇艺加入龙蜥社区,携手打造多元化视频生态底座

OpenAnolis小助手

开源 爱奇艺 龙蜥社区 CLA 社区建设

技术分享| HTTP 代理

anyRTC开发者

https 音视频 网络协议 HTTP

泛云桌面关键技术分析

A池伟

云桌面 算力网络

【招募】2022向光奖|年度ESG影响力投资奖正式启动!

创业邦

【LeetCode】最长的斐波那契子序列的长度Java题解

Albert

LeetCode 7月月更

蛋糕可以一刀切,研发需求可以吗? | 敏捷实践

LigaAI

程序员 敏捷 产品经理 需求分析 敏捷管理

手机怎样控制led显示屏发视频?

Dylan

ipad 手机 wifi LED LED显示屏

SpringBoot自动装配原理

急需上岸的小谢

7月月更

十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o系列合并,非思维链模型到头!_AI&大模型_华卫_InfoQ精选文章