写点什么

十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o 系列合并,非思维链模型到头!

  • 2025-02-13
    北京
  • 本文字数:3035 字

    阅读完需:约 10 分钟

大小:1.45M时长:08:26
十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o系列合并,非思维链模型到头!

整理 |华卫、核子可乐


今天一大早(2 月 13 日),OpenAI CEO 萨姆·奥特曼 (Sam Altman) 突然公开放出该公司最新的 AI 模型路线图,预告了 GPT-4.5 和 GPT-5 的未来规划。奥特曼表示,OpenAI 将在不久后推出 GPT-5 模型,该模型将在 ChatGPT 和 API 中整合多项 OpenAI 技术。GPT-5 推出之前,OpenAI 计划先发布其最后一个“非思维链模型”GPT-4.5(内部称之为 Orion )。


在被询问 GPT-4.5 和 GPT-5 模型的预计发布时间时,奥特曼虽然没有给出具体日期,但回复了这样的时间框架:“周 / 月”。也就是说,或预计几周内会推出 GPT - 4.5,几个月内会推出 GPT - 5。所以,GPT-5 很有可能在今年问世。



值得注意的是,除介绍产品路线图外,奥特曼还谈到了 ChatGPT 现在令人困惑的界面设计,即强迫用户在不同模型版本中做出选择以完成不同任务。OpenAI 正试图简化模型选择,在此之后,他们的首要目标是通过创建可以使用其所有工具、知道何时长时间思考或不长时间思考并且通常对非常广泛的任务有用的系统来统一 o 系列模型和 GPT 系列模型。


奥特曼在 “更新版路线图” 指出,去年 12 月高调亮相的 o3 推理模型,不会按原计划独立发布,而是会整合到 GPT - 5 中。o3 于去年 12 月首次亮相。在 Frontier Math(一项包含特别困难的数学问题的基准)上创下了 25.2% 的记录,上个月该公司还推出了由 o3 提供支持、可以独立进行深入网络研究、数据分析和报告编写等任务的 Deep Research。


不过,据 OpenAI 开发人员体验主管 Romain Huet 透露,其 API 依然支持 o3 推理功能。Huet 称,“我们将继续提供用户需要的所有控制功能,例如‘推理力度’设置,这样用户就可以直接从一个 GPT-5 系统中使用所有功能和工具。敬请期待!”



OpenAI 产品规划大变


根据奥特曼的说法,OpenAI 的产品阵容已经变得复杂,并表示该公司希望在简化产品方面 “做得更好” 。他在帖子中回应乔布斯的著名口号道:“我们希望人工智能能为你‘顺利运行’,也意识到目前 OpenAI 的模型和产品线已经变得太过复杂。我们和你们一样讨厌模型选择器,希望回归到那种神奇的统一智能状态。”


其字里行间透露出:ChatGPT 对用户来说有点像“迷宫”,他们必须从几个名称易混淆的人工智能模型中选择由哪个来回答自己的问题。事实也的确如此,用户面临的挑战是弄清楚要从哪种类型的模型开始使用:是大型语言 GPT 系列模型和推理 o 系列模型中的哪一个。OpenAI 也面临确定哪种类型的模型能够提供用户所需响应的挑战,当然这是 OpenAI 接下来要解决的问题。


与之形成对比的是当前大火的 DeepSeek,仅凭一款语言模型 V3 和一款推理模型 R1 便斩获一众用户。


而 ChatGPT 的复杂性主要归咎于产品发布速度过快,不同模型在性能、推理能力和计算要求方面进行了权衡。OpenAI 目前提供多种多样(在有些人眼中则是令人困惑)的模型组合,其中 GPT 代表语言型大模型,最早于 2018 年推出,从 GPT-1 一直迭代到现在的 GPT-4 系列;“o”系列代表推理模型,第一代于去年 9 月推出,三个月后又发布了新一代的 o3;“Dall-e”为图像生成模型,“Sora”为视频生成模型,“GPT-Vision”则属于视觉理解模型。



对于 Plus 用户,ChatGPT 应用程序目前包括这些型号选项和说明:


  • GPT-4o:适用于大多数问题

  • 带计划任务的 GPT-4o:要求 ChatGPT 稍后跟进

  • o1:使用高级推理

  • o3-mini:快速进行高级推理

  • o3-mini-high:擅长编码和逻辑

  • GPT-4o mini:大多数问题速度更快

  • GPT-4:传统模型


如何解决?就是回归奥特曼所谓“神奇的统一智能”。OpenAI 计划统一其人工智能模型,把各种文本模型(包括神秘的 o 系列与 GPT 系列)合并为能够处理从休闲聊天到复杂分析等各类需求的单一系统,用户不必在 ChatGPT 界面上专门为当前任务选择运行哪种 GPT。


真正的转折点将出现在 GPT-5 身上,它应该会整合 OpenAI 麾下所有技术。据奥特曼介绍,GPT-5 的设计更加通用、智能和用户友好,主要目标之一是消除在不同人工智能模型之间切换的复杂性,并创建一个能高效处理各种任务的系统。


因此,听起来 OpenAI 想要的是一个总括性的人工智能,它足够聪明,可以根据任务来选择运行哪些 GPT 模型。但这一变化也可能会让人怀疑,ChatGPT 是在利用其最强大的人工智能模型,还是在使用较老的技术。此前就有消息人士称,GPT-4.5 在输出质量方面的改进“远小于”其前身 GPT-4 在发布时提供的质量。


此番调整还意味着,OpenAI 未来将不会继续以独立产品的形式继续发布推理 / 编码模型(包括目前已经发布的 o3 模型),而是将其功能统一整合到 GPT-5 系统当中。对于使用 OpenAI API 的开发人员来说,这样的集成过程将更加简单——他们不必在不同模型间做出选择,而可以直接访问具备多种任务处理能力的单一系统。


然而,这种尝试也可能适得其反,因为肯定有某些用例需要明确搭配算力消耗更少、单 token 价格更低的模型才能保持利润空间。OpenAI 并未详细说明此举将对 API 成本造成何种影响。但奥特曼坚信这番调整将物有所值,并预计 GPT-5 的能力将极其强大,还在最近于柏林进行的一次讨论中搞了波宣传。他强调称,“我认为人类已经很难说比 GPT-5 更聪明了。”


一大波免费用户福利


这些发展正值 OpenAI 在人工智能领域的主导地位面临日益激烈的竞争之际,几周前,中国的 DeepSeek 凭借其强大且低成本的开源模型让 OpenAI 和整个 AI 世界都措手不及。毫无疑问,OpenAI 感受到了 DeepSeek 这股新晋开源竞争势力带来的威胁。


在过去一年中,OpenAI 在免费版和 20 美元 / 月的 Plus 版之上推出了新的 ChatGPT 订阅层级,即每月 200 美元的 ChatGPT Pro。除此之外,该公司还发布了 Operator 智能体、Deep Research、ChatGPT 任务和许多其他新功能,但这些功能有时只能通过特定模型或付费级别获得。


此次,OpenAI 宣布将通过 ChatGPT 免费套餐开放集成各项功能的 GPT-5。奥特曼详细介绍了 ChatGPT 中 GPT-5 的分级访问系统:免费用户将以 “标准智能设置 ”获得无限聊天权限,但需遵守反滥用限制,而 Plus 用户将以增强智能级别访问 GPT-5,专业版用户将受益于更强的最高智能级别,包括语音、绘图、搜索、Deep Research 等更多功能。


消息一出,有用户称,“刚刚取消了 Open AI 的付费版本。”但也有氪金系用户表示,“我喜欢模型选择。有时,我想扔 0.01 美元去解决一个问题,无需等待;有时,我想扔 1 美元去解决它,然后等待。”


紧随其后,OpenAI 官方这边也发布一连串更新:所有 Pro 用户在所有 ChatGPT 终端 / 网页端,皆可体验 Deep Reasearch;o1 和 o3-mini 现支持在 ChatGPT 中上传文件和图片;o3-mini-high 的限额暴涨了 7 倍,Plus 用户每天最多可使用 50 次。



昨日,奥特曼还宣布,免费用户也将能够体验 Deep Reasearch 了,每个月 2 次;Plus 用户每月 10 次。奥特曼表示,自己对一些用户每天希望进行数十次深入研究需求感到震惊,未来会找到一种方法,让大家灵活支付想要的计算资源。有网友不禁感叹,“想想 openAI 最初是个非营利组织”、“真正的 AGI 会收取多少费用?”


总之接下来 OpenAI 发布的重要模型将受到 AI 行业的密切关注,许多人都想知道,该公司在大规模扩展大语言模型方面持续投入的巨额资金取得了怎样的成效。


参考链接:


https://www.techmeme.com/250212/p35#a250212p35


https://siliconangle.com/2025/02/12/openai-launch-gpt-5-matter-months-gpt-4-5-within-weeks/


https://decrypt.co/305681/openai-ceo-sam-altman-shares-new-gpt-5-roadmap


https://www.pcmag.com/news/with-deepseek-hot-on-its-heels-openai-teases-gpt-45-gpt-5-launch


2025-02-13 14:4910756

评论

发布
暂无评论

Agisoft Metashape Professional 高精度3D模型 + 多格式支持,协同工作无忧

Rose

铁路运输行业怎么定义?为什么要用到堡垒机?

行云管家

等保 堡垒机 铁路行业 运输

Steinberg Cubase Pro 14 for Mac破解版安装教程 多功能音乐制作

Rose

京东商品详情数据接口(JD.item_get)丨京东API接口代码指南

tbapi

京东API接口 京东商品详情接口 京东商品数据采集

音视频编解码SDK开发的流程

北京木奇移动技术有限公司

音视频开发 音视频技术 软件开发定制

工单+远程技术支持一个方案就搞定!贝锐向日葵技术支持方案升级

科技热闻

PHP爬虫的使用与开发

科普小能手

php 爬虫 爬虫教程 PHP开发

Understand for Mac(优秀的源代码审查工具)

Rose

Cinema 4D 2023激活补丁(C4D 2023中文版)-Mac/win

Rose

TunesKit Subtitle Editor Mac版 功能强大的字幕编辑工具

Rose

Word 2024 LTSC for Mac(word 2024)永久破解版

Rose

安全研究年终总结-分享2024年RCE类的CVE漏洞高危EXP集合!

安全乐谷

网络安全 数据安全 安全漏洞 漏洞分析 安全扫描

HarmonyOS开发宝典震撼来袭,卓越应用开发之旅一触即发,轻松启程!

HarmonyOS开发者

LED电子屏厂家解密:LED控制系统的硬件设计

Dylan

系统 电子 LED display LED显示屏 市场

CST软件如何得到方向性系数随频率扫描的曲线

思茂信息

教程 仿真 cst

曲靖具有资质等保测评机构在哪里?电话多少?

行云管家

等保 堡垒机 等保评测 曲靖

SmoothScroll for mac v1.6.0永久激活版 鼠标增强工具

Rose

以数据驱动增长,火山引擎数智平台“数据找人”为双12营销提效

字节跳动数据平台

电商 数据飞轮 双十二

DispCam DisneyPlus Video Downloader for Mac(迪士尼视频下载工具)v1.1.1 激活版

Rose

考核信息化管理平台(源码+文档+部署+讲解)

深圳亥时科技

智源Aquila-VL-2B模型成为首个Linux基金会MOF评级达到“最开源”Class I等级的模型

智源研究院

音视频监控SDK开发的技术难点

北京木奇移动技术有限公司

音视频开发 音视频技术 软件开发定制

DaisyDisk for Mac:可视化磁盘清理,释放空间超轻松

Rose

Renamer 7 for mac 中文激活版 最好的批处理文件重命名工具

Rose

Python爬虫实战:调用微店商品详情接口(Micro.item_get)

代码忍者

API 接口 pinduoduo API

得物商家客服从Electron迁移到Tauri的技术实践

得物技术

typescript rust Vue 前端 前端 electron

十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o系列合并,非思维链模型到头!_AI&大模型_华卫_InfoQ精选文章