写点什么

OpenAI 推出专注于可靠性的 o3-pro 模型,用户反馈褒贬不一

作者:Robert Krzaczyński

  • 2025-06-24
    北京
  • 本文字数:849 字

    阅读完需:约 3 分钟

大小:446.39K时长:02:32
OpenAI推出专注于可靠性的o3-pro模型,用户反馈褒贬不一

OpenAI 推出了 o3-pro,这是其最先进模型的新版本,目标是在复杂任务中提供更可靠、周到的响应。现在,Pro 和 Team 用户可以在 ChatGPT 中或通过 API 使用 o3-pro,它取代了早期的 o1-pro。

 

基于 o3 架构的 o3-pro 保留了对 Python、文件分析、网页浏览和图像解释等工具的访问权限,使其能够解决多方面的问题。该模型专为那些优先考虑正确性和深度而非速度的用户设计。OpenAI 提醒说,o3-pro 的响应生成时间可能比更轻量级的模型要长。

 

专家和学术评估显示新模型有所改进。OpenAI 报告称,在“4/4 可靠性”测试中——即模型必须连续四次正确回答同一个问题——o3-pro 的表现超过了 o1-pro 和基础 o3。它在清晰度、遵循指令和特定领域的强度方面也得分更高,特别是在 STEM、写作和商业环境中。


来源:help.openai.com

 

一些用户认为 o3-pro 是一个实用的升级。一条评论总结道:

 

这只是 o1-pro 的 o3 版本……不是游戏规则的改变者,但它可能会在之前刚好差口气的任务上跨越门槛,这可能导致巨大的生产力提升。

 

然而,早期测试者也提出了担忧。性能较慢是一个缺点:

 

它在算法问题上做得还可以,但花费的时间太长了……Android 和 macOS 应用程序经常超时。

 

其他人对幻觉问题是否得到解决表示怀疑:

 

对我来说,完整的 o3 一度让我大开眼界,但最近我意识到它产生了太多幻觉,这成了一个大问题。我怀疑 o3-pro 是否解决了这个问题。我在 ChatGPT 的自定义指令中总是要求在提出主张时引用来源,包括直接引用,因为我希望这能减少幻觉,但它并没有。我经常查询医疗相关的事情,它经常会编造不存在的数字或直接引用。

 

这种挫败感在更广泛的批评中得到了呼应:

 

在这一点上,我不需要更智能的通用模型来完成我的工作。我需要的是不产生幻觉的模型,速度更快/成本更低,并且在特定领域有更好的品味。我认为这就是我们将看到未来改进的地方。

 

值得注意的是,由于技术限制,o3-pro 目前不支持图像生成、Canvas 或临时聊天。这些功能仍然可以通过其他模型如 GPT-4o 和 o4-mini 访问。

 

原文链接:OpenAI Launches o3-pro Model Focused on Reliability, Amid Mixed User Feedback

2025-06-24 13:004386

评论

发布
暂无评论
发现更多内容

物联网通信技术最全科普!你一定要了解的NB-IoT

华为云开发者联盟

物联网

呕心沥血,整理200+最新面试题,面试之前看一下,事半功倍

小Q

Java 学习 程序员 架构 面试

一步搞定任意圆角背景

mengxn

android xml 圆角

CSS常用样式——绘制单(双)箭头的多种方法(2)

程序员学院

CSS html 程序员

使用开源软件构建工业互联网的平台

刘旭东

工业互联网 Odoo thingsboard

未来经济 数字优先 | 大数据专场

腾讯云大数据

大数据

去中心化交易所搭建,虚拟币去中心化交易系统

交易所开发

【万字长文】探讨可信构架之道

华为云开发者联盟

架构 服务端

边缘计算,如何啃下集群管理这块硬骨头?

BoCloud博云

云计算 容器 边缘计算 PaaS 博云

Polkadot初识,不止于跨链

QTech

polkadot 跨链

市值做市机器人,操盘做市系统搭建

indexOf原理,Java,javascript,python实现

叫练

算法

传统产业数字化转型的思考与建议

CECBC

经济转型 企业经济

大厂运维必备技能:PB级数据仓库性能调优

华为云开发者联盟

架构 数据

教师节特别活动:第四范式多项自研技术及其应用实践分享

天枢数智运营

人工智能 推荐系统 第四范式 个性化推荐

Redis 哨兵模式

是老郭啊

redis redis哨兵模式 redis哨兵 redis哨兵集群

当心这些“坑”!阿里云服务器部署前后端分离项目

麦洛

nginx 前后端分离 跨域

合约跟单app,永续合约交易所带单交易软件

20张图,大学四年都没整明白的操作系统就这么学会了

小Q

Java 程序员 架构 操作系统

[翻译]The Go scheduler[Go调度]

卓丁

Go scheduler Go 语言

甲方日常10

句子

工作 随笔杂谈 日常

MySQL高性能架构设计原则

码界西柚

[翻译]Go Concurrency Patterns[Go 并发模式]

卓丁

Rob Pike Go Concurrency Patterns Concurrency Go 语言

新基建夯实粤港澳大湾区高质量发展基础

CECBC

区块链 人工智能 大数据

The Go Blog-Article index

卓丁

模板方法模式——看看 JDK 和 Spring 是如何优雅复用代码的

Java架构师迁哥

协同新机遇:让研发敏捷起来

人称T客

未读消息(小红点),前端与 RabbitMQ实时消息推送实践,贼简单~

程序员小富

Java RabbitMQ mqtt

云图说 | GPU共享型AI容器,让AI开发更普及

华为云开发者联盟

AI 容器

XSKY ClickHouse如何实现存算分离

XSKY星辰天合

LeetCode题解:225. 用队列实现栈,两个队列,压入 -O(1), 弹出 -O(n),JavaScript,详细注释

Lee Chen

大前端 LeetCode

OpenAI推出专注于可靠性的o3-pro模型,用户反馈褒贬不一_云计算_InfoQ精选文章