写点什么

OpenAI 深夜炸场!一口气放出 o1 模型全家桶,月费 200 美元的 Pro 模式被狂怼:Altman 疯狂捞金!

  • 2024-12-06
    北京
  • 本文字数:2695 字

    阅读完需:约 9 分钟

大小:1.30M时长:07:33
OpenAI深夜炸场!一口气放出o1模型全家桶,月费200美元的Pro模式被狂怼:Altman疯狂捞金!

刚刚,OpenAI 震惊圈内的“12 天连续轰炸”正式开启。在首场直播中,OpenAI 宣布了两件事:


第一,o1 完整版现在上线 ChatGPT,即将上线 API,比 o1-Preview 更智能、更快、功能更多(如多模态)。


第二,200 美元 / 月的 ChatGPT Pro 模式下,可以无限制访问 OpenAI 的所有先进模型。

o1 完整版:错误率减少 34%,响应速度快 50%

OpenAI 宣布正在发布其 o1 模型的完整版本(取代 o1-preview),该模型最初于 9 月作为有限预览版发布(代号为“Strawberry”)。新模型将于今日面向 ChatGPT Plus 和 Team 用户推出,而 Enterprise 和 Edu 用户将从下周开始使用该模型。


那么,该完整版模型能力到底怎么样?


据 OpenAI 称,与 o1 和 o1-preview 相比,o1 pro 在数学、科学和编码等具有挑战性的 ML 基准测试中表现更佳,在处理图像和文本(类似于 GPT-4o)时也比 o1-preview 快得多。



OpenAI 比较了 o1-preview、o1 和 o1 pro 模式的性能。


在一个关于罗马皇帝的现场演示问题中,o1 花了 14 秒回答问题,而 o1-preview 花了 33 秒才给出答案。据 OpenAI 称,o1 在“现实世界难题”上减少了 34% 的“重大错误”,而“思考”速度快 50%。据报道,一旦部署完成,将 GPU 转换为新模型,该模型的速度也会变得更快。


o1 不需要 ChatGPT Pro 订阅。从今天下午开始,所有 ChatGPT 付费用户都可以通过 ChatGPT 模型选择器工具访问 o1。OpenAI 表示,它计划在未来几个月内增加对网页浏览、文件上传等功能的支持。


o1 也将很快在 OpenAI 的 API 中推出,并具有包括函数调用(即使用外部工具的能力)和图像分析等新功能。


现在,ChatGPT Pro 的订阅用户将获得比那些没有订阅的用户更好的 o1 版本。OpenAI 表示,这种模式被称为 o1 pro 模式,它“使用更多的计算来为最难的问题提供最佳答案”。


ChatGPT Pro 用户可以通过在模型选择器中选择“o1 pro mode”并直接提问来访问该功能。由于生成答案需要更长时间,ChatGPT 将显示进度条,并在用户切换到另一个对话时发送应用内通知。


o1 pro 版本可能只是增加了模型在给出答案之前所需的“推理”时间。OpenAI 在其 o1-preview 公告中表示,其目标是试验推理时间长达数小时、数天甚至数周的 o1 模型,以进一步提升其推理能力,这很可能是朝着这个方向迈出的一步。


OpenAI 发言人在接受外媒采访时表示:“在外部专家测试人员的评估中,o1 pro 模式能够提供更可靠、更准确、更全面的响应,尤其是在数据科学、编程和案例分析等领域。”“与 o1 和 o1-preview 相比,o1 pro 模式在数学、科学和编码等具有挑战性的机器学习基准测试中表现更好。特别是,我们看到更容易编码的竞赛问题的错误减少了 75%,更能反映日常编程查询。”


o1 完整版本的发布在 Reddit 社区上引发了用户们的热议。


有用户对于 o1 回答问题速度之快表示震惊, 并表示自己其实还没准备好,但或许通用人工智能很快就来了。


也有用户认为,即使推出了很多超级强大的模型,但我们距离通用人工智能还有很长的路要走。


这些强大的大模型无法像人类一样进行广泛而深入的研究和发明,它们的记忆力就像金鱼一样。它们无法像人类一样连续数月或数年无所事事地完成项目,因此无法完成人类在数字世界中所做的许多事情。

o1 不是 AGI,因为它根本不通用。如果 AGI 真的存在,我们所知道的生活绝对会有所不同,几乎从定义上来说都是如此。


200 美元的 Pro 模式被热议:价格上涨了 10 倍


根据 OpenAI 的介绍,其新增的 ChatGPT Pro 模式是一个 200 美元的月度订阅套餐。在该模式下,用无限制访问 OpenAI 的最佳模型和工具,包括 o1 的 mini 及 pro 版本、GPT-4o 和高级语音。


总的来说,ChatGPT Pro 提供了对其最智能模型版本的访问,可以获得思考时间更长的可靠响应。


例如,在外部专家测试人员的评估中,o1 pro 模式可以产生更可靠、更准确、更全面的响应,尤其是在数据科学、编程和判例法分析等领域。与 o1 和 o1-preview 相比,o1 pro 模式在数学、科学和编码等具有挑战性的 ML 基准测试中表现更好。



为了突出 o1 pro 模式提高可靠性的主要优势,OpenAI 使用了更严格的评估设置:只有当模型在四次尝试中有四次尝试(“4/4 可靠性”)中正确回答时,才会被视为可以解决问题,而不仅仅是一次。


目前,Pro 用户可以通过在模型选取器中进行选择并直接提出问题来访问此功能。由于生成答案需要较长的时间,ChatGPT 会显示进度条,并在用户切换到其他对话时发送应用内通知。



在 OpenAI 看来,“ChatGPT Pro 为研究人员、工程师和其他每天使用研究级智能的个人提供了一种加快生产力的方式,让他们站在人工智能进步的最前沿。”未来,他们还将在此计划中添加更强大的计算密集型生产力功能。


但有网友认为,允许无限制的 AVM 、o1 访问以及在 o1 上进行“更深入的思考”,其实只是更长的 CoT 线程。



此外,该模式的价格也引发了许多用户的质疑:“200 美元对于普通人来说太贵了,买不起有用但并非必备的软件”,“AI 通常不应该随着时间的推移而变得更便宜吗?”“这是‘非营利组织’吗?”



毕竟,从 ChatGPT Plus(20 美元 / 月)切换到 ChatGPT Pro(200 美元 / 月)代表价格上涨了 10 倍。也有网友表示,该模式或许适用于企业用户。



不过此前就有外媒报道,OpenAI 正在努力向非营利组织转变。前不久,代表马斯克和其 AI 初创公司 xAI 的律师团队还向联邦法院提交了一项初步禁令,申请禁止 OpenAI 转型为完全营利性企业,并阻止 OpenAI 要求投资者避免为其竞争对手(包括 xAI 和其他公司)提供资金的行为。


有意思的是,OpenAI 特地提到,为了帮助在造福人类的领域取得有意义的进步,他们将向美国领先机构的医学研究人员提供 10 项 ChatGPT Pro 资助,并计划在未来将 Pro 资助扩展到其他地区和研究领域。

One more thing


尽管 OpenAI 一口气放出了这么多模型来“秀肌肉”,但过去几天已经有几款开源模型争夺榜首位置,尤其是国内刚发布的 DeepSeek R1 Lite 和 AIibaba 的 Qwen 2.5 也备受瞩目。X 上的一位用户对泄漏的消息做出了评论,他说:“如果真的会有 200 美元的计划,那么我看不到它的未来,因为我们现在有很多开源工具。”


无论如何,从今天开始,OpenAI 将正式启动了为期 12 天的新功能、新产品和演示“shipmas”期。

据悉,其中包括将发布 OpenAI 期待已久的文本转视频 AI 工具 Sora 和一个新模型的公告。OpenAI 还计划在 ChatGPT 中增加对网页浏览、文件上传等的支持,但这些变化没有时间表。


在 o1 的代码演示中,我们还发现了 GPT-4.5 预览版。



从 OpenAI 官网可以看到,ChatGPT Team 计划将提供“有限预览版 GPT-4.5“(尚不可见)。




参考链接:

https://openai.com/index/openai-o1-system-card/

https://openai.com/index/introducing-chatgpt-pro/


2024-12-06 06:008930
用户头像
李冬梅 加V:busulishang4668

发布了 1137 篇内容, 共 755.7 次阅读, 收获喜欢 1276 次。

关注

评论

发布
暂无评论
发现更多内容

灵魂拷问:后端业务开发要会用 K8s 到什么程度?

阿里巴巴云原生

容器 运维 云原生 k8s 存储

Iceberg0.11与Spark3.0结合

InfoQ_Springup

iceberg

博睿数据携手阿里云,打造以用户为中心的智能运维生态

博睿数据

阿里云 智能运维 博睿数据

这个好用的分布式应用配置中心,我们把它开源了

百度Geek说

分布式 大前端 服务器

XDPool比特兄弟矿场系统开发|XDPool比特兄弟矿场APP软件开发

微服务化转型,拆就行了?这样做很危险...

BoCloud博云

微服务

如何从一段视频中一次性修整多个片段

奈奈的杂社

视频剪辑 视频后期 视频处理

交通流量预测,EasyDL带你零代码实战

百度大脑

零代码 EasyDL

Flink+Clickhouse构建实时数仓的最佳实践

Wping

大数据 flink 实时数仓 Clickhouse

双非渣硕,是如何拿到苏宁、阿里的offer的?(分享学习心得)

Java 程序员 架构 面试

SecSolar:为代码“捉虫”,让你能更专心写代码

华为云开发者联盟

代码 华为云 CloudIDE 代码安全检测 SecSolar

NetWebCore实现文件上传功能

happlyfox

学习 .net core 5月日更

v03.06 鸿蒙内核源码分析(时钟任务) | 触发调度谁的贡献最大 | 百篇博客分析HarmonyOS源码

鸿蒙研究站

鸿蒙内核源码分析 百篇博客分析鸿蒙

抱歉,“行业毒瘤”这个锅,低/无代码不背

陈思

低代码 无代码 低代码平台 无代码平台

精选Hadoop高频面试题17道,附答案详细解析

五分钟学大数据

大数据 hadoop 5月日更

hive的主流文件存储格式对比实验

大数据技术指南

大数据 hive 5月日更

🕋【Redis干货领域】彻底走进主从架构的世界(入门篇)

码界西柚

主从同步 Redis 核心技术与实战 5月日更 Redis系列专题 原理篇

【实战问题】-- 布隆过滤器的三种实践:手写,Redission以及Guava(2)

秦怀杂货店

Java 布隆过滤器

这是我金三银四收到的第6个Offer:美团+阿里Java研发岗

Java 程序员 架构 面试

【死磕JVM】用Arthas排查JVM内存 真爽!我从小用到大

牧小农

JVM

引荐好友成为推广者还能拿额外奖励?!华为云引荐奖励计划来啦!

华为云开发者联盟

文章 返现奖励 推广计划 返利 团长

数据产品经理的圣经,送你一份真贵的礼物 ~~ 年度数据产品经理们的总结

松子(李博源)

大数据 数据产品经理 数据产品

51CTO熊平:HarmonyOS是大势所趋

科技汇

KubeVela + KEDA:为应用带来“与生俱来”的弹性伸缩能力

阿里巴巴云原生

容器 开发者 云原生 监控 中间件

iOS 面试策略之语言工具-Xcode使用

iOSer

ios xcode 语言 & 开发

NAT穿透原理详解

IT酷盖

音视频 p2p NAT

Golang command source code

escray

学习 极客时间 Go 语言 5月日更

音视频实战(6)- RTSP媒体协议流的录制方案及其覆盖策略详解

liuzhen007

音视频 5月日更 签约计划第二季

雀食蟀!Java Netty实战入门

北游学Java

Java Netty 网络 框架

Java开发5年,我为什么选择从蚂蚁金服离职?浅谈经历和经验!

Java架构追梦

Java 架构 面试 蚂蚁金服 经历分享

兄弟矿场系统开发|兄弟矿场软件APP开发

OpenAI深夜炸场!一口气放出o1模型全家桶,月费200美元的Pro模式被狂怼:Altman疯狂捞金!_OpenAI_华卫_InfoQ精选文章