写点什么

OpenAI 推出专注于可靠性的 o3-pro 模型,用户反馈褒贬不一

作者:Robert Krzaczyński

  • 2025-06-24
    北京
  • 本文字数:849 字

    阅读完需:约 3 分钟

大小:446.39K时长:02:32
OpenAI推出专注于可靠性的o3-pro模型,用户反馈褒贬不一

OpenAI 推出了 o3-pro,这是其最先进模型的新版本,目标是在复杂任务中提供更可靠、周到的响应。现在,Pro 和 Team 用户可以在 ChatGPT 中或通过 API 使用 o3-pro,它取代了早期的 o1-pro。

 

基于 o3 架构的 o3-pro 保留了对 Python、文件分析、网页浏览和图像解释等工具的访问权限,使其能够解决多方面的问题。该模型专为那些优先考虑正确性和深度而非速度的用户设计。OpenAI 提醒说,o3-pro 的响应生成时间可能比更轻量级的模型要长。

 

专家和学术评估显示新模型有所改进。OpenAI 报告称,在“4/4 可靠性”测试中——即模型必须连续四次正确回答同一个问题——o3-pro 的表现超过了 o1-pro 和基础 o3。它在清晰度、遵循指令和特定领域的强度方面也得分更高,特别是在 STEM、写作和商业环境中。


来源:help.openai.com

 

一些用户认为 o3-pro 是一个实用的升级。一条评论总结道:

 

这只是 o1-pro 的 o3 版本……不是游戏规则的改变者,但它可能会在之前刚好差口气的任务上跨越门槛,这可能导致巨大的生产力提升。

 

然而,早期测试者也提出了担忧。性能较慢是一个缺点:

 

它在算法问题上做得还可以,但花费的时间太长了……Android 和 macOS 应用程序经常超时。

 

其他人对幻觉问题是否得到解决表示怀疑:

 

对我来说,完整的 o3 一度让我大开眼界,但最近我意识到它产生了太多幻觉,这成了一个大问题。我怀疑 o3-pro 是否解决了这个问题。我在 ChatGPT 的自定义指令中总是要求在提出主张时引用来源,包括直接引用,因为我希望这能减少幻觉,但它并没有。我经常查询医疗相关的事情,它经常会编造不存在的数字或直接引用。

 

这种挫败感在更广泛的批评中得到了呼应:

 

在这一点上,我不需要更智能的通用模型来完成我的工作。我需要的是不产生幻觉的模型,速度更快/成本更低,并且在特定领域有更好的品味。我认为这就是我们将看到未来改进的地方。

 

值得注意的是,由于技术限制,o3-pro 目前不支持图像生成、Canvas 或临时聊天。这些功能仍然可以通过其他模型如 GPT-4o 和 o4-mini 访问。

 

原文链接:OpenAI Launches o3-pro Model Focused on Reliability, Amid Mixed User Feedback

2025-06-24 13:004264

评论

发布
暂无评论

宇宙级计算机大佬吐血整理出2224页计算机系统文档(离线版)

Java~~~

Java 架构 面试 TCP 操作系统

啥?阿里DBA团队总监把MySQL 性能调优 金字塔,写进了800页笔记?

Java~~~

Java MySQL 数据库 架构 面试

vivo全球商城时光机 - 大型促销活动保障利器

vivo互联网技术

电商平台 优惠券 亿级架构设计 促销系统

良心!鹅厂强推的SpringCloud、Nginx高并发编程

Java~~~

Java nginx spring 架构 面试

脱钩!打工人都觉得香的Java程序员306道面试秘笈,爆肝

Java~~~

Java spring 架构 面试 微服务

牛皮了!华为世界顶级Linux大牛总结出了3788页进阶笔记

Java~~~

Java Linux 架构 面试 运维

2021预备秋招:Java面试必看的1000道面试解析,助你通过大厂面试

Java 程序员 架构 面试 后端

不愧是阿里内部“SpringCloudAlibaba学习笔记”这细节讲解,神了

Java 程序员 架构 微服务 计算机

【Google Cloud】「Contact Center AI」引领我们走向高度智能客服的时代

码界西柚

话题王者 8月日更 Contact Center AI Google Cloud

阿里五位大佬总结操作系统+程序员必知硬核知识离线版pdf火了

Java~~~

Java 架构 面试 操作系统 网络

阿里P8整理出SQL笔记:收获不止SOL优化抓住SQL的本质

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

2W字!详解20道Redis经典面试题!(珍藏版)

Java redis 架构 后端 计算机

Github上标星250k的阿里Java面试复盘手册,看完竟如此的无敌?

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

在GitHub发布秒获百万访问!就凭这份Java程序性能优化实战笔记?

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

千金难求!火遍GitHub的这份阿里Java面试汇总已上热搜

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

接口管理进阶-环境变量的使用

CodeNongXiaoW

大前端 测试 后端 接口文档 接口管理

卧 底 人 类 高 质 量 A I 公 司

白洞计划

Python代码阅读(第22篇):从源字典映射出新字典

Felix

Python 编程 Code Programing 阅读代码

GitHub惊现!全网首份开源的深入理解JVMG1GC的算法与实现手册

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

阿里内部流传的JDK源码剖析手册!GitHub已获上千万的访问量

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

五分钟搞定Docker安装ElasticSearch

咔咔

Docker 死磕Elasticsearch

Github惊现神作,这份算法宝典让你横扫各大厂算法面试题

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

MySQL到ClickHouse的高速公路-MaterializeMySQL引擎

华为云数据库小助手

sql GaussDB dba 华为云数据库 DAS

别再找我给你重启程序啦!让你supervisor帮你搞定

Java 程序员 架构 后端

Vue进阶(八十五):vue-router Hash模式跳转及懒加载

No Silver Bullet

Vue 路由 8月日更

封笔之作!阿里P8手写的Java高手是怎样练成的原理方法与实践笔记

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

技术干货 | 应用性能提升 70%,探究 mPaaS 全链路压测的实现原理和实施路径

蚂蚁集团移动开发平台 mPaaS

压测 网关 移动开发 mPaaS

阿里被转载上100W次的Java面试题教程!已助我拿下9家大厂offer

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

八家知名大厂联合手写的Java面试手册刚上线!竟就到达巅峰?

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

爆料!前华为微服务专家纯手打500页落地架构实战笔记,已开源

Java~~~

Java spring 架构 面试 微服务

IM技术分享:万人群聊消息投递方案的思考和实践

JackJiang

即时通讯 IM 群聊

OpenAI推出专注于可靠性的o3-pro模型,用户反馈褒贬不一_云计算_InfoQ精选文章