
OpenAI最近发布了他们GPT-5模型的升级。GPT-5.1 即时版,即默认的聊天模型,对指令遵循进行了改进。GPT-5.1 思考版,即推理模型,速度更快,给出的回应更易于理解。GPT‑5.1-Codex-Max,即编程模型,经过训练使用压缩技术来执行长期运行的任务。
即时版和思考版模型被用于 ChatGPT 应用程序中,并且由自动路由模型自动选择。OpenAI 表示,用户想要的是可以愉快交谈的模型,这导致公司改变了他们模型的默认响应风格。新版本还包括对聊天语气和风格的更多自定义控制。ChatGPT 已经有几种预设风格,新版本包括三种新风格:古怪、坦率和专业。用户还可以通过个性化设置和自定义指令调整响应风格。
今年早些时候,OpenAI 推出GPT-5时引发了争议,因为他们取消了选择旧模型的选项,破坏了许多用户的工作流程。尽管公司继续让 ChatGPT 自动选择最佳模型进行聊天,但 OpenAI 撤销了立即弃用旧模型的计划。根据 OpenAI 的说法:
展望未来,当我们引入新的 ChatGPT 模型时,我们的方法是要给人们足够的空间来评估变化并分享反馈,这使我们能够在顺利过渡的同时继续创新我们的前沿模型。我们将清晰并提前通知下线日期。
对模型响应设置的更新是 OpenAI 努力使 ChatGPT 的个性“[感觉]独特正确”的一部分。公司表示,预设的响应风格是基于“我们对人们如何自然引导模型的了解”开发的。虽然预设风格随着发布向所有人推出,但微调设置正在分批向一些用户推出,作为一种实验。
一些 Hacker News 的用户对这个模型的对话语气并不满意,他们更喜欢简洁的回答。一位用户指出,“高效”(以前的“机器人”)预设就是为了解决这个问题。另一个写道:
似乎这里的人们对“对话式”人工智能聊天机器人相当消极。ChatGPT 有很多挫折和伦理问题,我和其他人一样讨厌阿谀奉承,但我不认为健谈是一件坏事。我想这只是个人喜好。
GPT-5.1-Codex-Max 是 OpenAI 的 GPT-5.1-Codex 编程模型的改进版本。在SWE-bench验证基准测试中,GPT-5.1-Codex-Max 的性能超过了之前的模型,同时使用的推理 token 更少。除了之前的低、中、高级别之外,该模型还具有一个额外高(xhigh)的推理努力级别。
GPT-5.1-Codex-Max 基准性能。图片来源:OpenAI博客
Hacker News 用户还讨论了GPT‑5.1-Codex-Max:
Codex CLI 很棒,我也经常使用它,但是我希望有更多方便的功能来管理 CC 中的上下文。我很高兴现在有了压缩功能,希望我们能得到更多管理上下文的功能。
另一位用户说:
如果能通过聊天界面访问这个模型,那就太棒了,即使它被限制在“其他模型”下拉菜单或类似的东西后面。
新的 Codex 模型可在Codex CLI和几个 IDE 扩展中使用。API 访问“即将推出”。
原文链接:







评论