写点什么

OpenAI 深夜炸场!一口气放出 o1 模型全家桶,月费 200 美元的 Pro 模式被狂怼:Altman 疯狂捞金!

  • 2024-12-06
    北京
  • 本文字数:2695 字

    阅读完需:约 9 分钟

大小:1.30M时长:07:33
OpenAI深夜炸场!一口气放出o1模型全家桶,月费200美元的Pro模式被狂怼:Altman疯狂捞金!

刚刚,OpenAI 震惊圈内的“12 天连续轰炸”正式开启。在首场直播中,OpenAI 宣布了两件事:


第一,o1 完整版现在上线 ChatGPT,即将上线 API,比 o1-Preview 更智能、更快、功能更多(如多模态)。


第二,200 美元 / 月的 ChatGPT Pro 模式下,可以无限制访问 OpenAI 的所有先进模型。

o1 完整版:错误率减少 34%,响应速度快 50%

OpenAI 宣布正在发布其 o1 模型的完整版本(取代 o1-preview),该模型最初于 9 月作为有限预览版发布(代号为“Strawberry”)。新模型将于今日面向 ChatGPT Plus 和 Team 用户推出,而 Enterprise 和 Edu 用户将从下周开始使用该模型。


那么,该完整版模型能力到底怎么样?


据 OpenAI 称,与 o1 和 o1-preview 相比,o1 pro 在数学、科学和编码等具有挑战性的 ML 基准测试中表现更佳,在处理图像和文本(类似于 GPT-4o)时也比 o1-preview 快得多。



OpenAI 比较了 o1-preview、o1 和 o1 pro 模式的性能。


在一个关于罗马皇帝的现场演示问题中,o1 花了 14 秒回答问题,而 o1-preview 花了 33 秒才给出答案。据 OpenAI 称,o1 在“现实世界难题”上减少了 34% 的“重大错误”,而“思考”速度快 50%。据报道,一旦部署完成,将 GPU 转换为新模型,该模型的速度也会变得更快。


o1 不需要 ChatGPT Pro 订阅。从今天下午开始,所有 ChatGPT 付费用户都可以通过 ChatGPT 模型选择器工具访问 o1。OpenAI 表示,它计划在未来几个月内增加对网页浏览、文件上传等功能的支持。


o1 也将很快在 OpenAI 的 API 中推出,并具有包括函数调用(即使用外部工具的能力)和图像分析等新功能。


现在,ChatGPT Pro 的订阅用户将获得比那些没有订阅的用户更好的 o1 版本。OpenAI 表示,这种模式被称为 o1 pro 模式,它“使用更多的计算来为最难的问题提供最佳答案”。


ChatGPT Pro 用户可以通过在模型选择器中选择“o1 pro mode”并直接提问来访问该功能。由于生成答案需要更长时间,ChatGPT 将显示进度条,并在用户切换到另一个对话时发送应用内通知。


o1 pro 版本可能只是增加了模型在给出答案之前所需的“推理”时间。OpenAI 在其 o1-preview 公告中表示,其目标是试验推理时间长达数小时、数天甚至数周的 o1 模型,以进一步提升其推理能力,这很可能是朝着这个方向迈出的一步。


OpenAI 发言人在接受外媒采访时表示:“在外部专家测试人员的评估中,o1 pro 模式能够提供更可靠、更准确、更全面的响应,尤其是在数据科学、编程和案例分析等领域。”“与 o1 和 o1-preview 相比,o1 pro 模式在数学、科学和编码等具有挑战性的机器学习基准测试中表现更好。特别是,我们看到更容易编码的竞赛问题的错误减少了 75%,更能反映日常编程查询。”


o1 完整版本的发布在 Reddit 社区上引发了用户们的热议。


有用户对于 o1 回答问题速度之快表示震惊, 并表示自己其实还没准备好,但或许通用人工智能很快就来了。


也有用户认为,即使推出了很多超级强大的模型,但我们距离通用人工智能还有很长的路要走。


这些强大的大模型无法像人类一样进行广泛而深入的研究和发明,它们的记忆力就像金鱼一样。它们无法像人类一样连续数月或数年无所事事地完成项目,因此无法完成人类在数字世界中所做的许多事情。

o1 不是 AGI,因为它根本不通用。如果 AGI 真的存在,我们所知道的生活绝对会有所不同,几乎从定义上来说都是如此。


200 美元的 Pro 模式被热议:价格上涨了 10 倍


根据 OpenAI 的介绍,其新增的 ChatGPT Pro 模式是一个 200 美元的月度订阅套餐。在该模式下,用无限制访问 OpenAI 的最佳模型和工具,包括 o1 的 mini 及 pro 版本、GPT-4o 和高级语音。


总的来说,ChatGPT Pro 提供了对其最智能模型版本的访问,可以获得思考时间更长的可靠响应。


例如,在外部专家测试人员的评估中,o1 pro 模式可以产生更可靠、更准确、更全面的响应,尤其是在数据科学、编程和判例法分析等领域。与 o1 和 o1-preview 相比,o1 pro 模式在数学、科学和编码等具有挑战性的 ML 基准测试中表现更好。



为了突出 o1 pro 模式提高可靠性的主要优势,OpenAI 使用了更严格的评估设置:只有当模型在四次尝试中有四次尝试(“4/4 可靠性”)中正确回答时,才会被视为可以解决问题,而不仅仅是一次。


目前,Pro 用户可以通过在模型选取器中进行选择并直接提出问题来访问此功能。由于生成答案需要较长的时间,ChatGPT 会显示进度条,并在用户切换到其他对话时发送应用内通知。



在 OpenAI 看来,“ChatGPT Pro 为研究人员、工程师和其他每天使用研究级智能的个人提供了一种加快生产力的方式,让他们站在人工智能进步的最前沿。”未来,他们还将在此计划中添加更强大的计算密集型生产力功能。


但有网友认为,允许无限制的 AVM 、o1 访问以及在 o1 上进行“更深入的思考”,其实只是更长的 CoT 线程。



此外,该模式的价格也引发了许多用户的质疑:“200 美元对于普通人来说太贵了,买不起有用但并非必备的软件”,“AI 通常不应该随着时间的推移而变得更便宜吗?”“这是‘非营利组织’吗?”



毕竟,从 ChatGPT Plus(20 美元 / 月)切换到 ChatGPT Pro(200 美元 / 月)代表价格上涨了 10 倍。也有网友表示,该模式或许适用于企业用户。



不过此前就有外媒报道,OpenAI 正在努力向非营利组织转变。前不久,代表马斯克和其 AI 初创公司 xAI 的律师团队还向联邦法院提交了一项初步禁令,申请禁止 OpenAI 转型为完全营利性企业,并阻止 OpenAI 要求投资者避免为其竞争对手(包括 xAI 和其他公司)提供资金的行为。


有意思的是,OpenAI 特地提到,为了帮助在造福人类的领域取得有意义的进步,他们将向美国领先机构的医学研究人员提供 10 项 ChatGPT Pro 资助,并计划在未来将 Pro 资助扩展到其他地区和研究领域。

One more thing


尽管 OpenAI 一口气放出了这么多模型来“秀肌肉”,但过去几天已经有几款开源模型争夺榜首位置,尤其是国内刚发布的 DeepSeek R1 Lite 和 AIibaba 的 Qwen 2.5 也备受瞩目。X 上的一位用户对泄漏的消息做出了评论,他说:“如果真的会有 200 美元的计划,那么我看不到它的未来,因为我们现在有很多开源工具。”


无论如何,从今天开始,OpenAI 将正式启动了为期 12 天的新功能、新产品和演示“shipmas”期。

据悉,其中包括将发布 OpenAI 期待已久的文本转视频 AI 工具 Sora 和一个新模型的公告。OpenAI 还计划在 ChatGPT 中增加对网页浏览、文件上传等的支持,但这些变化没有时间表。


在 o1 的代码演示中,我们还发现了 GPT-4.5 预览版。



从 OpenAI 官网可以看到,ChatGPT Team 计划将提供“有限预览版 GPT-4.5“(尚不可见)。




参考链接:

https://openai.com/index/openai-o1-system-card/

https://openai.com/index/introducing-chatgpt-pro/


2024-12-06 06:008656
用户头像
李冬梅 加V:busulishang4668

发布了 983 篇内容, 共 588.4 次阅读, 收获喜欢 1143 次。

关注

评论

发布
暂无评论
发现更多内容

从“一云多芯”支持,看多元算力的全栈云方案

华为云开发者联盟

云计算 华为云 企业号十月 PK 榜 多元算力

TiDB 的 graceful shutdown

TiDB 社区干货传送门

Java Web(三)HTML和CSS

浅辄

Java web HTML5, CSS3 11月月更

备战双11,送你一份解压壁纸!

OceanBase 数据库

震惊,改密码这件小事竟然让他差点累到吐血...

嘉为蓝鲸

运维 IT #WeOps

经验分享|用 Flutter 如何开发一个可运行小程序的 App

FinClip

云原生可观测套件:构建无处不在的可观测基础设施

阿里巴巴云原生

阿里云 云原生 可观测

带你了解NLP的词嵌入

华为云开发者联盟

人工智能 自然语言处理 华为云 企业号十月 PK 榜

被老板忽悠入局后,我如何在三年内让产品「起死回生」?

LigaAI

产品经理 产品管理 产品管理成功秘诀 产品负责人 企业号十月PK榜

一文了解 DataLeap 中的 Notebook

字节跳动数据平台

大数据 火山引擎 DataLeap

HDC 2022重磅首发《鸿蒙生态应用开发白皮书》,附全文

HarmonyOS开发者

HarmonyOS

开源共建携手并进 OpenHarmony使能千行百业生态成果亮相HDC2022

OpenHarmony开发者

OpenHarmony

TiDB 2022 Hackathon 产品组决赛“不负责任”点评

TiDB 社区干货传送门

共筑行业标准,亚信科技AntDB数据库参与多项数据库行业标准研讨会

亚信AntDB数据库

AntDB aisware antdb AntDB数据库

上新丨Kyligence Zen 上线海量指标模板,轻松变身指标达人

Kyligence

数据分析 指标管理 指标中台

盒马 iOS Live Activity &“灵动岛”配送场景实践

阿里巴巴终端技术

ios 灵动岛

焱融全闪系列科普|固态存储核心技术 SSD

焱融科技

云计算 分布式 高性能 文件存储 全闪存储

号称Java圣经!Github上爆火的1058页JVM全栈小册到底有什么魅力

Java全栈架构师

程序人生 JVM 架构师 java面试 jvm调优

即时通讯技术文集(第5期):零基础通信技术入门 [共15篇]

JackJiang

即时通信

TiKV 源码阅读三部曲(二)读流程

TiDB 社区干货传送门

带你从0到1开发AI图像分类应用

华为云开发者联盟

人工智能 华为云 图像分类 企业号十月 PK 榜

DevOps工具链的国产化之道

嘉为蓝鲸

DevOps 运维 IT

案例故事丨MySQL or TiDB?HTAP 数据库在中国 SaaS 行业头部服务商的应用实践

TiDB 社区干货传送门

2022年11月中国数据库排行榜:GaussDB获认证进前五,GBase得融资竞逐鹿

墨天轮

数据库 opengauss TiDB 国产数据库 KingBase

DDL 毫秒级同步,Light Schema Change 的设计与实现|新版本揭秘

SelectDB

数据库 大数据 Doris schema 企业号十月 PK 榜

API 网关 Apache APISIX 3.0 版本正式发布!

API7.ai 技术团队

Apache 开源 APISIX 新版本/特性发布

PingCAP 携手阿里云,探索 TiDB 云原生的进阶之路

TiDB 社区干货传送门

EMR with TiSpark(on EKS )

TiDB 社区干货传送门

CSS 边框也能动画?background-origin 和 -clip 来施加魔法~

掘金安东尼

CSS 11月月更

Curve 文件存储:如何支撑百亿级文件?

网易数帆

文件存储 分布式存储 云原生存储 curve 企业号十月 PK 榜

WeOps赋能制造业数字化,助力坚美铝业IT高效管理

嘉为蓝鲸

DevOps 运维 AIOPS weops 嘉为蓝鲸

OpenAI深夜炸场!一口气放出o1模型全家桶,月费200美元的Pro模式被狂怼:Altman疯狂捞金!_OpenAI_华卫_InfoQ精选文章