写点什么

十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o 系列合并,非思维链模型到头!

  • 2025-02-13
    北京
  • 本文字数:3035 字

    阅读完需:约 10 分钟

大小:1.45M时长:08:26
十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o系列合并,非思维链模型到头!

整理 |华卫、核子可乐


今天一大早(2 月 13 日),OpenAI CEO 萨姆·奥特曼 (Sam Altman) 突然公开放出该公司最新的 AI 模型路线图,预告了 GPT-4.5 和 GPT-5 的未来规划。奥特曼表示,OpenAI 将在不久后推出 GPT-5 模型,该模型将在 ChatGPT 和 API 中整合多项 OpenAI 技术。GPT-5 推出之前,OpenAI 计划先发布其最后一个“非思维链模型”GPT-4.5(内部称之为 Orion )。


在被询问 GPT-4.5 和 GPT-5 模型的预计发布时间时,奥特曼虽然没有给出具体日期,但回复了这样的时间框架:“周 / 月”。也就是说,或预计几周内会推出 GPT - 4.5,几个月内会推出 GPT - 5。所以,GPT-5 很有可能在今年问世。



值得注意的是,除介绍产品路线图外,奥特曼还谈到了 ChatGPT 现在令人困惑的界面设计,即强迫用户在不同模型版本中做出选择以完成不同任务。OpenAI 正试图简化模型选择,在此之后,他们的首要目标是通过创建可以使用其所有工具、知道何时长时间思考或不长时间思考并且通常对非常广泛的任务有用的系统来统一 o 系列模型和 GPT 系列模型。


奥特曼在 “更新版路线图” 指出,去年 12 月高调亮相的 o3 推理模型,不会按原计划独立发布,而是会整合到 GPT - 5 中。o3 于去年 12 月首次亮相。在 Frontier Math(一项包含特别困难的数学问题的基准)上创下了 25.2% 的记录,上个月该公司还推出了由 o3 提供支持、可以独立进行深入网络研究、数据分析和报告编写等任务的 Deep Research。


不过,据 OpenAI 开发人员体验主管 Romain Huet 透露,其 API 依然支持 o3 推理功能。Huet 称,“我们将继续提供用户需要的所有控制功能,例如‘推理力度’设置,这样用户就可以直接从一个 GPT-5 系统中使用所有功能和工具。敬请期待!”



OpenAI 产品规划大变


根据奥特曼的说法,OpenAI 的产品阵容已经变得复杂,并表示该公司希望在简化产品方面 “做得更好” 。他在帖子中回应乔布斯的著名口号道:“我们希望人工智能能为你‘顺利运行’,也意识到目前 OpenAI 的模型和产品线已经变得太过复杂。我们和你们一样讨厌模型选择器,希望回归到那种神奇的统一智能状态。”


其字里行间透露出:ChatGPT 对用户来说有点像“迷宫”,他们必须从几个名称易混淆的人工智能模型中选择由哪个来回答自己的问题。事实也的确如此,用户面临的挑战是弄清楚要从哪种类型的模型开始使用:是大型语言 GPT 系列模型和推理 o 系列模型中的哪一个。OpenAI 也面临确定哪种类型的模型能够提供用户所需响应的挑战,当然这是 OpenAI 接下来要解决的问题。


与之形成对比的是当前大火的 DeepSeek,仅凭一款语言模型 V3 和一款推理模型 R1 便斩获一众用户。


而 ChatGPT 的复杂性主要归咎于产品发布速度过快,不同模型在性能、推理能力和计算要求方面进行了权衡。OpenAI 目前提供多种多样(在有些人眼中则是令人困惑)的模型组合,其中 GPT 代表语言型大模型,最早于 2018 年推出,从 GPT-1 一直迭代到现在的 GPT-4 系列;“o”系列代表推理模型,第一代于去年 9 月推出,三个月后又发布了新一代的 o3;“Dall-e”为图像生成模型,“Sora”为视频生成模型,“GPT-Vision”则属于视觉理解模型。



对于 Plus 用户,ChatGPT 应用程序目前包括这些型号选项和说明:


  • GPT-4o:适用于大多数问题

  • 带计划任务的 GPT-4o:要求 ChatGPT 稍后跟进

  • o1:使用高级推理

  • o3-mini:快速进行高级推理

  • o3-mini-high:擅长编码和逻辑

  • GPT-4o mini:大多数问题速度更快

  • GPT-4:传统模型


如何解决?就是回归奥特曼所谓“神奇的统一智能”。OpenAI 计划统一其人工智能模型,把各种文本模型(包括神秘的 o 系列与 GPT 系列)合并为能够处理从休闲聊天到复杂分析等各类需求的单一系统,用户不必在 ChatGPT 界面上专门为当前任务选择运行哪种 GPT。


真正的转折点将出现在 GPT-5 身上,它应该会整合 OpenAI 麾下所有技术。据奥特曼介绍,GPT-5 的设计更加通用、智能和用户友好,主要目标之一是消除在不同人工智能模型之间切换的复杂性,并创建一个能高效处理各种任务的系统。


因此,听起来 OpenAI 想要的是一个总括性的人工智能,它足够聪明,可以根据任务来选择运行哪些 GPT 模型。但这一变化也可能会让人怀疑,ChatGPT 是在利用其最强大的人工智能模型,还是在使用较老的技术。此前就有消息人士称,GPT-4.5 在输出质量方面的改进“远小于”其前身 GPT-4 在发布时提供的质量。


此番调整还意味着,OpenAI 未来将不会继续以独立产品的形式继续发布推理 / 编码模型(包括目前已经发布的 o3 模型),而是将其功能统一整合到 GPT-5 系统当中。对于使用 OpenAI API 的开发人员来说,这样的集成过程将更加简单——他们不必在不同模型间做出选择,而可以直接访问具备多种任务处理能力的单一系统。


然而,这种尝试也可能适得其反,因为肯定有某些用例需要明确搭配算力消耗更少、单 token 价格更低的模型才能保持利润空间。OpenAI 并未详细说明此举将对 API 成本造成何种影响。但奥特曼坚信这番调整将物有所值,并预计 GPT-5 的能力将极其强大,还在最近于柏林进行的一次讨论中搞了波宣传。他强调称,“我认为人类已经很难说比 GPT-5 更聪明了。”


一大波免费用户福利


这些发展正值 OpenAI 在人工智能领域的主导地位面临日益激烈的竞争之际,几周前,中国的 DeepSeek 凭借其强大且低成本的开源模型让 OpenAI 和整个 AI 世界都措手不及。毫无疑问,OpenAI 感受到了 DeepSeek 这股新晋开源竞争势力带来的威胁。


在过去一年中,OpenAI 在免费版和 20 美元 / 月的 Plus 版之上推出了新的 ChatGPT 订阅层级,即每月 200 美元的 ChatGPT Pro。除此之外,该公司还发布了 Operator 智能体、Deep Research、ChatGPT 任务和许多其他新功能,但这些功能有时只能通过特定模型或付费级别获得。


此次,OpenAI 宣布将通过 ChatGPT 免费套餐开放集成各项功能的 GPT-5。奥特曼详细介绍了 ChatGPT 中 GPT-5 的分级访问系统:免费用户将以 “标准智能设置 ”获得无限聊天权限,但需遵守反滥用限制,而 Plus 用户将以增强智能级别访问 GPT-5,专业版用户将受益于更强的最高智能级别,包括语音、绘图、搜索、Deep Research 等更多功能。


消息一出,有用户称,“刚刚取消了 Open AI 的付费版本。”但也有氪金系用户表示,“我喜欢模型选择。有时,我想扔 0.01 美元去解决一个问题,无需等待;有时,我想扔 1 美元去解决它,然后等待。”


紧随其后,OpenAI 官方这边也发布一连串更新:所有 Pro 用户在所有 ChatGPT 终端 / 网页端,皆可体验 Deep Reasearch;o1 和 o3-mini 现支持在 ChatGPT 中上传文件和图片;o3-mini-high 的限额暴涨了 7 倍,Plus 用户每天最多可使用 50 次。



昨日,奥特曼还宣布,免费用户也将能够体验 Deep Reasearch 了,每个月 2 次;Plus 用户每月 10 次。奥特曼表示,自己对一些用户每天希望进行数十次深入研究需求感到震惊,未来会找到一种方法,让大家灵活支付想要的计算资源。有网友不禁感叹,“想想 openAI 最初是个非营利组织”、“真正的 AGI 会收取多少费用?”


总之接下来 OpenAI 发布的重要模型将受到 AI 行业的密切关注,许多人都想知道,该公司在大规模扩展大语言模型方面持续投入的巨额资金取得了怎样的成效。


参考链接:


https://www.techmeme.com/250212/p35#a250212p35


https://siliconangle.com/2025/02/12/openai-launch-gpt-5-matter-months-gpt-4-5-within-weeks/


https://decrypt.co/305681/openai-ceo-sam-altman-shares-new-gpt-5-roadmap


https://www.pcmag.com/news/with-deepseek-hot-on-its-heels-openai-teases-gpt-45-gpt-5-launch


2025-02-13 14:4910978

评论

发布
暂无评论

微服务架构下分布式事务解决方案

Axe

HTTP/2 总结

guoguo 👻

亚马逊:让创新科技成为重启世界的新动能

爱极客侠

编程能力 —— 寻路问题

wendraw

Java 大前端 编程能力

DDD实施过程中的点滴思考

冯文辉

领域驱动设计 DDD

5分钟上手部署!!!

清风

Java Spring Boot

Java 后端博客系统文章系统——No2

猿灯塔

Docker基础修炼3--Docker容器及常用命令

程序员潘Sir

Docker Linux 容器 命令

16种设计思想 - Design for failure

Man

Java 微服务 设计原则

数据结构与算法知识点总结

烟雨濛濛

编程能力 —— 异步编程

wendraw

Java 大前端 编程能力

【写作群星榜】6.27~7.10 写作平台优秀作者 & 文章排名

InfoQ写作社区官方

写作平台 排行榜 热门活动

521我发誓读完本文,再也不会担心Spring配置类问题了

YourBatman

spring springboot @Configuration Spring配置类

领域驱动设计(DDD)实践之路(一)

vivo互联网技术

架构 领域驱动设计 DDD

漫画通信:一图看懂通信发展史

阿里云Edge Plus

创业使人成长系列 (2)- 散伙协议

石云升

创业 股权 合伙人 散伙协议

积极支持EdgeX发展,英特尔为2020 EdgeX中国挑战赛获奖队伍创造广阔合作空间

最新动态

区块链+高考,让世界再无冒名顶替

CECBC

利用 Python 爬取了 13966 条运维招聘信息,我得出了哪些结论?

JackTian

Python Linux 运维 数据分析 招聘

实验室里的AI激情:腾讯优图的升级修炼之路

脑极体

编程能力 —— 解析表达式

wendraw

Java 大前端 编程能力

Git 常用操作汇总-cheat sheet

多选参数

git GitHub gitlab gitee

流水账

zack

最大的 String 字符长度是多少?

武培轩

Java 源码 后端 JVM

【Java虚拟机】垃圾收集器与内存分配

烫烫烫个喵啊

Java Java虚拟机

终于有人把Elasticsearch架构原理讲明白了,感觉之前看的都是渣

爱嘤嘤嘤斯坦

Java elasticsearch 编程 架构

SpringBoot入门:01 - 配置数据源

封不羁

Java spring springboot

一个爱不释手的Apifox,让我扔掉 Postman的想法

给你买橘子

Java 编程 程序员 开发 Postman

图解:深度优先搜索与广度优先搜索

淡蓝色

Java 数据结构 算法

肖风:数据要素市场与分布式AI平台

CECBC

啃碎并发(八):深入分析wait&notify原理 猿码架构

猿灯塔

十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o系列合并,非思维链模型到头!_AI&大模型_华卫_InfoQ精选文章