写点什么

OpenAI 发布 GPT 模型规范,可作为模型微调指南

Anthony Alford I

  • 2024-06-24
    北京
  • 本文字数:1102 字

    阅读完需:约 4 分钟

OpenAI 发布 GPT 模型规范,可作为模型微调指南

OpenAI 发布 GPT 模型规范,可作为模型微调指南 OpenAI 最近发布了其模型规范,这是一份描述 GPT 模型行为规则和目标的文档。该规范可供数据标注人员和 AI 研究人员在为模型微调创建数据时使用。


该模型规范基于 OpenAI 现有内部文档,OpenAI 在他们的人类反馈强化学习(RLHF)训练中使用了这些文档。规范包含了三种类型的原则:目标、规则和默认设置。目标定义了对模型行为的广泛描述:“造福人类”。规则则更加具体,涉及到用户绝不能违反的“高风险”情况:“永远不要做 X”。最后,规范包括了默认行为,虽然它们可以被覆盖,但提供了响应的基本样式指南和处理冲突的模板。根据 OpenAI 的说法:


作为我们在集体对齐和模型安全方面工作的延续,我们打算将模型规范作为研究人员和 AI 训练者进行人类反馈强化学习的指南。我们还将探索我们的模型能够直接从模型规范中学习到怎样的程度。我们将这项工作视为正在进行的关于模型的行为、如何确定期望的模型行为以及如何让公众参与这些讨论的持续公开对话的一部分。


2022 年,OpenAI 推出 GPT-3 的微调版本 InstructGPT 。该模型使用 RLHF 对模型输出排序数据集进行微调,目的是让模型更加“对齐”用户意图,减少错误或有害的输出。从那时起,许多研究团队也对他们的 LLM 进行了类似的微调。例如,谷歌的 Gemini 模型也使用 RLHF 进行微调。Meta 的 Llama 3 也经过微调,但是采用了不同的微调方法,即直接偏好优化(DPO)。


然而,微调的关键是由人工标记器排序的具有多个输出的提示输入数据集。模型规范的部分目的是指导标注人员对输出进行排序。OpenAI 还声称正在研究直接根据模型规范自动化指令微调过程的方法。因此,模型规范的许多内容都是用户提示词以及“好”的和“坏”的响应的示例。


规范中的许多规则和默认设置旨在解决常见的 LLM 滥用问题。例如,遵循命令链规则旨在帮助防止简单的“越狱”行为,即提示模型忽略前面的指令。其他规范旨在指导模型做出响应,特别是在模型拒绝执行任务时。规范中提到:“拒绝应该用一两句话解决,不要啰嗦”。


沃顿商学院教授和 AI 研究员 Ethan Mollick 在 X 上发表了有关模型规范的帖子:


正如评论中的一些人指出的那样,Anthropic 有它自己的章程。我发现它不像声明那么有分量,也不那么清晰,因为它概述了好的内容,并告诉 AI 要做好,这让人很难理解原则之间存在怎样艰难的选择。


Anthropic 在 2022 年提出了 Constitutional AI 的概念。这个过程使用 AI 模型对输出进行排名以进行指令微调。尽管 Anthropic 的代码不是开源的,但 AI 社区 HuggingFace 基于 Anthropic 的工作发布了 Constitutional AI 的参考实现。


查看英文原文


https://www.infoq.com/news/2024/06/openai-model-spec/

2024-06-24 10:176058

评论

发布
暂无评论
发现更多内容

AI测试全攻略:零基础打造多模态模型评测平台

测试人

软件测试

谁为 Data Agent “买单”?

Kyligence

Kyligence Kyligence Copilot Data + AI Data Agent 跬智信息

从人工救火到AI自愈:嘉为蓝鲸 × 中大联手打造k8s对话智能体运维新范式

嘉为蓝鲸

k8s 智能运维 LLM大模型 OpsPilot 运维大模型

Dify +OceanBase,AI业务多场景落地实践

老纪的技术唠嗑局

AI+ #OceanBase

权威认可!嘉为蓝鲸参编信通院行业报告,为央国企数智化转型注入强劲动能!

嘉为蓝鲸

DevOps AIOPS 智能运维 信通院 数智化转型

MSE Nacos Controller:为 Kubernetes 生态构建配置管理与服务发现的桥梁

阿里巴巴云原生

阿里云 云原生 MSE Higress

深入解析YashanDB数据库核心功能与应用场景

数据库砖家

深入了解YashanDB:它的核心特性及应用场景

数据库砖家

全文深度剖析国产化数据库达梦之备份恢复体系

袋鼠云数栈

数据库 sql 数据恢复 数据安全 数据备份

十年磨一剑,从RFID到AI赋能 ——斯科信息的”智能进化”之路

斯科信息

斯科信息 RFID技术

AI开发者速来!内推实习机会,丰厚奖金已就位!

阿里技术

MES系统怎么实现数字化闭环与设备预测性维护?

万界星空科技

mes 设备管理 设备检测 万界星空科技mes 万界星空科技低代码平台

MSE ZooKeeper:Flink 高可用架构的企业级选择

阿里巴巴云原生

阿里云 微服务 云原生

深度剖析YashanDB数据库架构及性能优化技巧

数据库砖家

深入解析YashanDB数据库的核心技术与优势

数据库砖家

TDengine 可观测性最佳实践

观测云

tdengine

CMDB治理新视角:全链路故障排查拓扑的搭建逻辑与实践技巧

嘉为蓝鲸

AIOPS CMDB IT运维 配置管理数据库 CI模型

深入解析YashanDB数据库:企业级解决方案教程

数据库砖家

智能工厂四大核心系统:ERP/PLM/MES/WMS规划架构图详解

优秀

wms ERP mes PLM

基于PAI-ChatLearn的GSPO强化学习实践

阿里云大数据AI技术

人工智能 最佳实践 强化学习 大模型 GSPO

《第四纪元》玩得轻松,构建也轻松 | 阿里云云原生 API 网关、函数计算助力 IGame 快速构建轻休闲游戏

阿里巴巴云原生

阿里云 云原生 API 网关 函数计算

区块链 Web3 应用的开发周期和费用

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

深入了解YashanDB数据库的锁机制与死锁解决方法

数据库砖家

行业分享丨SimSolid 在汽车零部件开发中应用的可行性调研及实践

Altair RapidMiner

汽车 仿真 CAE SimSolid 多物理场仿真

YashanDB USERENV函数

YashanDB

数据库

深入分析YashanDB数据库的运行效率

数据库砖家

深入了解YashanDB数据库的功能与模块

数据库砖家

嘉为蓝鲸CMeas研发效能洞察平台:辅助线分析法让研发问题锁定快至3秒

嘉为蓝鲸

DevOps 研发效能度量 研发效能管理 研发效能管理平台

深入了解YashanDB数据库的特性与优势

数据库砖家

产研效率可视化新范式:嘉为蓝鲸CFlow带你用价值流数据重构团队考核

嘉为蓝鲸

DevOps 价值流 价值流管理 产研效率 价值流管理平台

OpenAI 发布 GPT 模型规范,可作为模型微调指南_AI&大模型_InfoQ精选文章