写点什么

十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o 系列合并,非思维链模型到头!

  • 2025-02-13
    北京
  • 本文字数:3035 字

    阅读完需:约 10 分钟

大小:1.45M时长:08:26
十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o系列合并,非思维链模型到头!

整理 |华卫、核子可乐


今天一大早(2 月 13 日),OpenAI CEO 萨姆·奥特曼 (Sam Altman) 突然公开放出该公司最新的 AI 模型路线图,预告了 GPT-4.5 和 GPT-5 的未来规划。奥特曼表示,OpenAI 将在不久后推出 GPT-5 模型,该模型将在 ChatGPT 和 API 中整合多项 OpenAI 技术。GPT-5 推出之前,OpenAI 计划先发布其最后一个“非思维链模型”GPT-4.5(内部称之为 Orion )。


在被询问 GPT-4.5 和 GPT-5 模型的预计发布时间时,奥特曼虽然没有给出具体日期,但回复了这样的时间框架:“周 / 月”。也就是说,或预计几周内会推出 GPT - 4.5,几个月内会推出 GPT - 5。所以,GPT-5 很有可能在今年问世。



值得注意的是,除介绍产品路线图外,奥特曼还谈到了 ChatGPT 现在令人困惑的界面设计,即强迫用户在不同模型版本中做出选择以完成不同任务。OpenAI 正试图简化模型选择,在此之后,他们的首要目标是通过创建可以使用其所有工具、知道何时长时间思考或不长时间思考并且通常对非常广泛的任务有用的系统来统一 o 系列模型和 GPT 系列模型。


奥特曼在 “更新版路线图” 指出,去年 12 月高调亮相的 o3 推理模型,不会按原计划独立发布,而是会整合到 GPT - 5 中。o3 于去年 12 月首次亮相。在 Frontier Math(一项包含特别困难的数学问题的基准)上创下了 25.2% 的记录,上个月该公司还推出了由 o3 提供支持、可以独立进行深入网络研究、数据分析和报告编写等任务的 Deep Research。


不过,据 OpenAI 开发人员体验主管 Romain Huet 透露,其 API 依然支持 o3 推理功能。Huet 称,“我们将继续提供用户需要的所有控制功能,例如‘推理力度’设置,这样用户就可以直接从一个 GPT-5 系统中使用所有功能和工具。敬请期待!”



OpenAI 产品规划大变


根据奥特曼的说法,OpenAI 的产品阵容已经变得复杂,并表示该公司希望在简化产品方面 “做得更好” 。他在帖子中回应乔布斯的著名口号道:“我们希望人工智能能为你‘顺利运行’,也意识到目前 OpenAI 的模型和产品线已经变得太过复杂。我们和你们一样讨厌模型选择器,希望回归到那种神奇的统一智能状态。”


其字里行间透露出:ChatGPT 对用户来说有点像“迷宫”,他们必须从几个名称易混淆的人工智能模型中选择由哪个来回答自己的问题。事实也的确如此,用户面临的挑战是弄清楚要从哪种类型的模型开始使用:是大型语言 GPT 系列模型和推理 o 系列模型中的哪一个。OpenAI 也面临确定哪种类型的模型能够提供用户所需响应的挑战,当然这是 OpenAI 接下来要解决的问题。


与之形成对比的是当前大火的 DeepSeek,仅凭一款语言模型 V3 和一款推理模型 R1 便斩获一众用户。


而 ChatGPT 的复杂性主要归咎于产品发布速度过快,不同模型在性能、推理能力和计算要求方面进行了权衡。OpenAI 目前提供多种多样(在有些人眼中则是令人困惑)的模型组合,其中 GPT 代表语言型大模型,最早于 2018 年推出,从 GPT-1 一直迭代到现在的 GPT-4 系列;“o”系列代表推理模型,第一代于去年 9 月推出,三个月后又发布了新一代的 o3;“Dall-e”为图像生成模型,“Sora”为视频生成模型,“GPT-Vision”则属于视觉理解模型。



对于 Plus 用户,ChatGPT 应用程序目前包括这些型号选项和说明:


  • GPT-4o:适用于大多数问题

  • 带计划任务的 GPT-4o:要求 ChatGPT 稍后跟进

  • o1:使用高级推理

  • o3-mini:快速进行高级推理

  • o3-mini-high:擅长编码和逻辑

  • GPT-4o mini:大多数问题速度更快

  • GPT-4:传统模型


如何解决?就是回归奥特曼所谓“神奇的统一智能”。OpenAI 计划统一其人工智能模型,把各种文本模型(包括神秘的 o 系列与 GPT 系列)合并为能够处理从休闲聊天到复杂分析等各类需求的单一系统,用户不必在 ChatGPT 界面上专门为当前任务选择运行哪种 GPT。


真正的转折点将出现在 GPT-5 身上,它应该会整合 OpenAI 麾下所有技术。据奥特曼介绍,GPT-5 的设计更加通用、智能和用户友好,主要目标之一是消除在不同人工智能模型之间切换的复杂性,并创建一个能高效处理各种任务的系统。


因此,听起来 OpenAI 想要的是一个总括性的人工智能,它足够聪明,可以根据任务来选择运行哪些 GPT 模型。但这一变化也可能会让人怀疑,ChatGPT 是在利用其最强大的人工智能模型,还是在使用较老的技术。此前就有消息人士称,GPT-4.5 在输出质量方面的改进“远小于”其前身 GPT-4 在发布时提供的质量。


此番调整还意味着,OpenAI 未来将不会继续以独立产品的形式继续发布推理 / 编码模型(包括目前已经发布的 o3 模型),而是将其功能统一整合到 GPT-5 系统当中。对于使用 OpenAI API 的开发人员来说,这样的集成过程将更加简单——他们不必在不同模型间做出选择,而可以直接访问具备多种任务处理能力的单一系统。


然而,这种尝试也可能适得其反,因为肯定有某些用例需要明确搭配算力消耗更少、单 token 价格更低的模型才能保持利润空间。OpenAI 并未详细说明此举将对 API 成本造成何种影响。但奥特曼坚信这番调整将物有所值,并预计 GPT-5 的能力将极其强大,还在最近于柏林进行的一次讨论中搞了波宣传。他强调称,“我认为人类已经很难说比 GPT-5 更聪明了。”


一大波免费用户福利


这些发展正值 OpenAI 在人工智能领域的主导地位面临日益激烈的竞争之际,几周前,中国的 DeepSeek 凭借其强大且低成本的开源模型让 OpenAI 和整个 AI 世界都措手不及。毫无疑问,OpenAI 感受到了 DeepSeek 这股新晋开源竞争势力带来的威胁。


在过去一年中,OpenAI 在免费版和 20 美元 / 月的 Plus 版之上推出了新的 ChatGPT 订阅层级,即每月 200 美元的 ChatGPT Pro。除此之外,该公司还发布了 Operator 智能体、Deep Research、ChatGPT 任务和许多其他新功能,但这些功能有时只能通过特定模型或付费级别获得。


此次,OpenAI 宣布将通过 ChatGPT 免费套餐开放集成各项功能的 GPT-5。奥特曼详细介绍了 ChatGPT 中 GPT-5 的分级访问系统:免费用户将以 “标准智能设置 ”获得无限聊天权限,但需遵守反滥用限制,而 Plus 用户将以增强智能级别访问 GPT-5,专业版用户将受益于更强的最高智能级别,包括语音、绘图、搜索、Deep Research 等更多功能。


消息一出,有用户称,“刚刚取消了 Open AI 的付费版本。”但也有氪金系用户表示,“我喜欢模型选择。有时,我想扔 0.01 美元去解决一个问题,无需等待;有时,我想扔 1 美元去解决它,然后等待。”


紧随其后,OpenAI 官方这边也发布一连串更新:所有 Pro 用户在所有 ChatGPT 终端 / 网页端,皆可体验 Deep Reasearch;o1 和 o3-mini 现支持在 ChatGPT 中上传文件和图片;o3-mini-high 的限额暴涨了 7 倍,Plus 用户每天最多可使用 50 次。



昨日,奥特曼还宣布,免费用户也将能够体验 Deep Reasearch 了,每个月 2 次;Plus 用户每月 10 次。奥特曼表示,自己对一些用户每天希望进行数十次深入研究需求感到震惊,未来会找到一种方法,让大家灵活支付想要的计算资源。有网友不禁感叹,“想想 openAI 最初是个非营利组织”、“真正的 AGI 会收取多少费用?”


总之接下来 OpenAI 发布的重要模型将受到 AI 行业的密切关注,许多人都想知道,该公司在大规模扩展大语言模型方面持续投入的巨额资金取得了怎样的成效。


参考链接:


https://www.techmeme.com/250212/p35#a250212p35


https://siliconangle.com/2025/02/12/openai-launch-gpt-5-matter-months-gpt-4-5-within-weeks/


https://decrypt.co/305681/openai-ceo-sam-altman-shares-new-gpt-5-roadmap


https://www.pcmag.com/news/with-deepseek-hot-on-its-heels-openai-teases-gpt-45-gpt-5-launch


2025-02-13 14:4910883

评论

发布
暂无评论

深入分析四层/七层网关

不在线第一只蜗牛

网关

解决华为NEXT应用开发中模拟器组件缺失问题

彭康佳

鸿蒙 an'droid

VMware vCenter Server 8.0U2d 下载 - 修复堆溢出 (远程执行代码) 和本地权限提升漏洞

sysin

vSphere vmware vcenter esxi

网络调试利器:Chrome Network工具的详细指南

霍格沃兹测试开发学社

快速掌握 WinRAR:详细安装与使用指南

霍格沃兹测试开发学社

破除“数据孤岛”新策略:Data Fabric(数据编织)和逻辑数据平台

Aloudata

数据管理 数据孤岛 数据虚拟化 Data Fabric 数据编织

使用 Apache JMeter 事务控制器的详细指南

霍格沃兹测试开发学社

使用 Apache JMeter 吞吐量控制器的详细指南

霍格沃兹测试开发学社

使用Python获取HTTP请求头数据

霍格沃兹测试开发学社

华为阅读亮相BIBF:以AI赋能出版行业,引领阅读新业态

最新动态

2024-06-19:用go语言,给定一个起始下标为 0 的整数数组 nums 和一个整数 k, 可以执行一个操作将相邻两个元素按位AND后替换为结果。 要求在最多执行 k 次操作的情况下, 计算数组

福大大架构师每日一题

福大大架构师每日一题

使用 Apache JMeter Flexible File Writer 插件的详细指南

霍格沃兹测试开发学社

Postman 集合变量使用详解

霍格沃兹测试开发学社

利用JAVA语言调用GLM-4接口实战指南

幂简集成

Java API 大模型

报名参加通义灵码高校训练营,领 300 元阿里云产品通用抵扣金

阿里云云效

阿里云 云原生

数据虚拟化和 Data Fabric(数据编织)对企业数据管理意味着什么?

Aloudata

数据管理 数据孤岛 数据虚拟化 Data Fabric 数据编织

多环境镜像晋级/复用最佳实践

阿里巴巴云原生

阿里云 云原生 云效

使用Python获取HTTP请求头数据

霍格沃兹测试开发学社

英伟达成全球市值第一公司;苹果暂停下一代高端头显研发丨 RTE 开发者日报 Vol.227

声网

火山引擎×OPPO,以多样化AI智能体为手机用户带来全新体验

新消费日报

VMware vCenter Server 7.0U3r 下载 - 修复堆溢出 (远程执行代码) 和本地权限提升漏洞

sysin

vSphere vcenter esxi

解决 JMeter 返回内容中文乱码问题的详细指南

霍格沃兹测试开发学社

报名参加通义灵码高校训练营,领 300 元阿里云产品通用抵扣金

阿里巴巴云原生

阿里云 云原生 通义灵码

MQTTX 1.10.0 发布:CLI高级文件管理与配置

EMQ映云科技

mqtt mqttx

为什么选择SD-WAN进行企业异地组网?

Ogcloud

SD-WAN 企业组网 SD-WAN组网 异地组网 SDWAN

使用 Apache JMeter 调度器的详细指南

霍格沃兹测试开发学社

VMware vCenter Server 8.0U1e 下载 - 修复堆溢出 (远程执行代码) 和本地权限提升漏洞

sysin

vSphere vcenter esxi

Altair 助力优化摩托车空气动力学性能,实现更好的整流罩设计

Altair RapidMiner

人工智能 仿真 AIGC altair

十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o系列合并,非思维链模型到头!_AI&大模型_华卫_InfoQ精选文章