写点什么

OpenAI 新的 GPT-5.1 模型更快、更具对话性

  • 2025-12-12
    北京
  • 本文字数:1091 字

    阅读完需:约 4 分钟

大小:568.63K时长:03:14
OpenAI新的GPT-5.1模型更快、更具对话性

OpenAI最近发布了他们GPT-5模型的升级。GPT-5.1 即时版,即默认的聊天模型,对指令遵循进行了改进。GPT-5.1 思考版,即推理模型,速度更快,给出的回应更易于理解。GPT‑5.1-Codex-Max,即编程模型,经过训练使用压缩技术来执行长期运行的任务。

 

即时版和思考版模型被用于 ChatGPT 应用程序中,并且由自动路由模型自动选择。OpenAI 表示,用户想要的是可以愉快交谈的模型,这导致公司改变了他们模型的默认响应风格。新版本还包括对聊天语气和风格的更多自定义控制。ChatGPT 已经有几种预设风格,新版本包括三种新风格:古怪、坦率和专业。用户还可以通过个性化设置和自定义指令调整响应风格。

 

今年早些时候,OpenAI 推出GPT-5时引发了争议,因为他们取消了选择旧模型的选项,破坏了许多用户的工作流程。尽管公司继续让 ChatGPT 自动选择最佳模型进行聊天,但 OpenAI 撤销了立即弃用旧模型的计划。根据 OpenAI 的说法:

 

展望未来,当我们引入新的 ChatGPT 模型时,我们的方法是要给人们足够的空间来评估变化并分享反馈,这使我们能够在顺利过渡的同时继续创新我们的前沿模型。我们将清晰并提前通知下线日期。

 

对模型响应设置的更新是 OpenAI 努力使 ChatGPT 的个性“[感觉]独特正确”的一部分。公司表示,预设的响应风格是基于“我们对人们如何自然引导模型的了解”开发的。虽然预设风格随着发布向所有人推出,但微调设置正在分批向一些用户推出,作为一种实验。

 

一些 Hacker News 的用户对这个模型的对话语气并不满意,他们更喜欢简洁的回答。一位用户指出,“高效”(以前的“机器人”)预设就是为了解决这个问题。另一个写道:

 

似乎这里的人们对“对话式”人工智能聊天机器人相当消极。ChatGPT 有很多挫折和伦理问题,我和其他人一样讨厌阿谀奉承,但我不认为健谈是一件坏事。我想这只是个人喜好。

 

GPT-5.1-Codex-Max 是 OpenAI 的 GPT-5.1-Codex 编程模型的改进版本。在SWE-bench验证基准测试中,GPT-5.1-Codex-Max 的性能超过了之前的模型,同时使用的推理 token 更少。除了之前的低、中、高级别之外,该模型还具有一个额外高(xhigh)的推理努力级别。

 


GPT-5.1-Codex-Max 基准性能。图片来源:OpenAI博客

 

Hacker News 用户还讨论了GPT‑5.1-Codex-Max

 

Codex CLI 很棒,我也经常使用它,但是我希望有更多方便的功能来管理 CC 中的上下文。我很高兴现在有了压缩功能,希望我们能得到更多管理上下文的功能。

 

另一位用户说:

 

如果能通过聊天界面访问这个模型,那就太棒了,即使它被限制在“其他模型”下拉菜单或类似的东西后面。

 

新的 Codex 模型可在Codex CLI和几个 IDE 扩展中使用。API 访问“即将推出”。

 

原文链接:

https://www.infoq.com/news/2025/12/openai-gpt-51/

2025-12-12 15:521

评论

发布
暂无评论

数据库治理的云原生之道 —— Database Mesh 2.0

SphereEx

Apache 数据库 开源 ShardingSphere SphereEx

元宇宙的十大经济规则

CECBC

大数据培训用SQL来实现用户行为漏斗分析

@零度

大数据开发

4种Springboot RestTemplate 服务里发送HTTP请求用法

华为云开发者联盟

Java Rest HTTP

揭秘亚马逊云科技软件开发工程师团队

亚马逊云科技 (Amazon Web Services)

软件开发 工程师

元宇宙用户已准备就绪,但技术瓶颈仍制约其真正“落地”

CECBC

【智人智语】史赛克全球数字化、机器人及赋能技术总裁柯若博:世界智能大会是一个非常重要的盛会

InfoQ 天津

GraphQL初探

RingCentral铃盛

JavaScript graphql

F5 NGINX 核心人员倾力打造,搞懂 NGINX 这一本就够了

图灵教育

nginx 程序员 服务器 计算机

【等保】等保测评中双因素认证是什么意思?等于双因子认证吗?

行云管家

网络安全 等保 双因子认证 等级保护

大数据ETL自动化调度运维专家-TASKCTL

敏捷调度TASKCTL

Docker 大数据 程序员 DevOps 数据仓库

技术分享 | Javaer 如何做单元测试?

LigaAI

Java 单元测试 LigaAI

周六晚8点,如何基于 eBPF 技术构建应用可观测平台?

OpenAnolis小助手

Linux 直播 内核 龙蜥社区 sig

谁需要实验室内部管理系统?

低代码小观

实验室管理系统 数据管理系统 LIMS实验室信息管理系统 企业管理工具 检查系统服务

敏捷领导力(CAL E+T+O)认证在线培训 | 2022年8月18-20日

ShineScrum

敏捷 敏捷领导力 CAL 世界级敏捷领导力大师

带你学习MindSpore中算子使用方法

华为云开发者联盟

模型 mindspore 算子

加码布局版式文档垂直赛道,福昕船舶图纸管理系统重磅发布

联营汇聚

虚拟化解决方案 virtio 的技术趋势与 DPU 实践解读 | 龙蜥技术

OpenAnolis小助手

虚拟化 技术分享 DPU 龙蜥大讲堂 云豹智能

图解|高性能服务器设计之缓存系统一致性

C++后台开发

redis 后端开发 Linux服务器开发 高性能服务器 系统缓存

【技术干货】代码示例:使用 Apache Flink 连接 TDengine

TDengine

数据库 tdengine

AI简报-增强版GAN图像超分:ESRGAN

AIWeker

人工智能 深度学习 5月月更 AI简报

二、KVM架构概述

穿过生命散发芬芳

kvm 5月月更

详解SQL操作的窗口函数

华为云开发者联盟

sql 窗口函数 AP场景

【云堡垒机】云堡垒机很贵吗?怎么收费?

行云管家

网络安全 数据安全 堡垒机 云堡垒机

华为AppCube通过中国信通院“低代码开发平台通用能力要求”评估!

华为云开发者联盟

低代码 华为云 AppCube

低碳数据中心建设思路及未来趋势

H3C-Navigator

HashSet源码分析-基础结构

zarmnosaj

5月月更

如何实现24/7客户服务自动化?建设智能客服知识库

小炮

从Oracle日志解析学习数据库内核原理

沃趣科技

oracle 数据库内核

OpenAI新的GPT-5.1模型更快、更具对话性_AI&大模型_Anthony Alford_InfoQ精选文章