阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

微软发布 Orca 2 LLM,表现优于 10 倍参数模型

作者:Anthony Alford

  • 2023-12-25
    北京
  • 本文字数:1209 字

    阅读完需:约 4 分钟

大小:591.51K时长:03:21
微软发布Orca 2 LLM,表现优于10倍参数模型

微软发布 Orca 2 LLM,这是 Llama 2 的一个调优版本,性能与包含 10 倍参数的模型相当,甚至更好。Orca 2 使用了一个合成训练数据集和一项称为 Prompt Erasure(提示词擦除) 的新技术来实现这一性能。


Orca 2 使用了师生模式的训练方案,其中一个较大、较强的 LLM 作为另一个较小的 LLM(学生)的老师,老师的目标是提升学生的性能,使其与更大模型的性能相媲美。微软的训练技术教会较小的模型多种推理技巧,并教其如何为特定任务选择最有效的技巧。为此,老师被赋予了复杂的提示词来触发某种推理行为。不过,在一种被称为 Prompt Erasure 的方案中,学生只得到任务要求和期望的响应,而不是老师的提示词。在基准测试中,一个拥有 13B 参数的 Orca 2 模型的表现超过了一个 13B 参数的基准 Llama 2 模型,提升了 47.54%。而一个拥有 7B 参数的 Orca 2 模型在推理任务方面与一个拥有 70B 参数的 Llama 2 模型相当,甚至更好。


尽管像 ChatGPT 这样的 LLM 在给定少量提示词的情况下通常表现良好,但由于其内存和计算需求较大,托管这些模型极具有挑战性。经过调优的较小的模型也可以表现良好,许多研究人员已经在研究使用较大 LLM 生成的合成数据集对它们进行训练。InfoQ 最近报道了谷歌的 Distilling Step-by-Step 方法,该方法会让老师 LLM 自动生成一个小型的调优数据集,其中包含输入和输出标签,以及为何选择输出标签的“基本原理”。InfoQ 还报道了 Stability AI 的 Stable Beluga 模型,它使用微软原始的 Orca 1 方案进行训练,该方案使用了 Explanation Tuning,其中老师 LLM 被提示“生成详细答案”。


与 Orca 1 类似,Orca 2 训练数据集是由老师 LLM 生成的,而老师 LLM 收到了详细的提示词。然而,微软新的训练方法 Cautious Reasoning 将训练任务与提示词相结合,引导老师 LLM 使用特定的问题解决策略,如“一步一步”或“解释你的答案”。然后在学生的训练过程中,老师的提示词被删除,这促使学生学会选择正确的策略。


为了评估这种方法,微软将 Orca 2 模型的性能与几个基准模型进行了比较,包括 Llama 2、ChatGPT(GPT-3.5)和 GPT-4。基准任务包括推理、语言理解、文本完成和摘要。在推理基准测试中,13B 参数 Orca 2 模型优于除 ChatGPT 和 GPT-4 之外的所有基准。他们还发现,给 Orca 2 一个“谨慎”的系统提示词(“你是一个谨慎的助手,你会仔细遵循指示”)相比无系统提示会略微提升其性能。


有几位用户在 X 上发表了关于 Orca 2 的帖子。一位用户指出:“你不需要用‘一步一步解释’这样的技巧来提示它。它自己知道。” AI 研究员 Rudi Ranck 写道


许多绝妙的想法都很简单……就像 Orca 2 中的“提示词擦除”一样:完整的提示词不会呈现给模型,而只呈现任务和答案(它过滤了生成这些答案所使用的完整提示词)。这有助于模型在更高层次上制定策略。这是一篇非常好的论文。我强烈建议通读全文。


7B13B 参数的 Orca 2 模型可在 Huggingface 上获得。


原文链接

https://www.infoq.com/news/2023/12/microsoft-orca-2-llm/

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-12-25 11:216249

评论

发布
暂无评论

如何利用 APM 追踪完整的类函数调用

观测云

性能优化

理性消费:了解租用国外服务器的实际成本

一只扑棱蛾子

独立服务器 国外服务器

智能语音助手在教育行业的应用与挑战

来自四九城儿

集合-Java-笛卡尔积、平铺

alexgaoyh

Java 集合运算 笛卡尔积 数据平铺

师爷,翻译翻译什么叫AOP

不在线第一只蜗牛

Java 数据库 前端 aop

1688商品列表数据接口(1688.item_search)

tbapi

1688 1688API 1688商品列表数据接口 关键词搜索1688商品数据

2023总结,瞳孔滤镜

程思扬

年度总结 2023计划 2023年 2024

1688公司档案信息数据接口采集Python

tbapi

1688API接口 1688公司档案信息接口

解读|如何利用 NFTScan 解锁当前 NFT 生态走势

NFT Research

NFT\ NFTScan NFT开发

苹果Mac版Luminar Neo 激活安装包

iMac小白

智能语音助手在旅游行业的应用与挑战

来自四九城儿

住宅代理IP在保护品牌形象中起到关键性作用

摘星星的猫

PTGui Pro for Mac(全景图拼接制作工具)v10.0.11永久激活版

iMac小白

fm足球经理Football Manager 2023 中文激活版下载

iMac小白

小飞贼防火墙 Little Snitch激活最新版下载

iMac小白

淘宝/天猫获得淘宝app商品详情原数据 API(taobao.item_get_app);可以用到哪些参数

技术冰糖葫芦

API

智能语音助手在医疗行业的应用与挑战

来自四九城儿

软件测试丨Docker_安装 Jenkins

测试人

软件测试 测试 自动化测试 测试开发

iPaaS架构深入探讨

RestCloud

企业集成 ipaas

Serial Box for Mac(软件序列号查询软件)v2024.01激活版

iMac小白

PDF Expert for Mac(PDF编辑阅读转换器)v3.8.2中文激活版

iMac小白

1688店铺联系方式API接口文档

tbapi

1688API接口 1688店铺联系方式接口

【好文翻译】JavaScript 中的 realm 是什么?

OpenTiny社区

前端 OpenTiny

SerialMailer for Mac(邮件批量处理软件)v8.1.10注册激活版

iMac小白

使用 Swift 代码优化项目编译速度

SerialMailer for Mac(邮件批量处理软件)v8.1.10注册激活版

iMac小白

3 种主要类型的云电脑服务模型

青椒云云电脑

云桌面 云电脑 云电脑平台

高效稳定!使用ETLCloud轻松同步千万数据

RestCloud

ETL 数据集成

HarmonyOS NEXT创新能力:助力开发者打造差异化竞争力

新消费日报

微信多开助手for mac下载

iMac小白

云桌面解决方案四大优势

青椒云云电脑

云桌面

微软发布Orca 2 LLM,表现优于10倍参数模型_微软_InfoQ精选文章