AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

Meta 发布 Llama 3.3:一个性能和效率均有所提升的多语言模型

作者:Robert Krzaczyński

  • 2025-01-03
    北京
  • 本文字数:1485 字

    阅读完需:约 5 分钟

Meta 发布 Llama 3.3:一个性能和效率均有所提升的多语言模型

Meta 发布了 Llama 3.3,这是一款多语言大语言模型,旨在支持研究和行业中的一系列人工智能应用。该模型具有 128k 个 token 上下文窗口,并对架构进行了改进以提高效率,在推理、编码和多语言任务的基准测试中表现出色。该模型在 Hugging Face 上以社区许可的形式提供。


Llama 3.3 对之前版本进行了改进,具有更长的上下文窗口,长达 128k 个 token,并使用分组查询注意力(Grouped-Query Attention,GQA)优化了 Transformer 架构,以实现更好的可扩展性和效率。它通过将监督学习和基于人类反馈的强化学习相结合来进行微调,确保在各种任务中的出色表现,同时保持有用性和安全性。


该模型在关键基准测试中表现出色。这个拥有 700 亿个参数的模型在多语言对话、推理、编码和安全评估方面的表现优于开源和专有替代方案:


  • 推理和知识:Llama 3.3 在具有挑战性的 GPQA 推理基准上,准确率达到了 50.5%,与其前身相比,有所改进。

  • 代码生成:该模型在 HumanEval 编码基准上,pass@1 达到了 88.4%,为人工智能辅助编程设定了高标准。

  • 多语言能力:在多语言推理基准 MGSM 上,Llama 3.3 的精确匹配(EM)得分为 91.1%。



来源:Hugging Face 博客


该模型的多语言流畅性和文本生成能力使其适用于构建人工智能助手、开发软件和生成内容。它对工具集成的支持使其能够与三方应用程序协同工作,以执行数据检索、计算和合成数据生成等任务。


Meta 在模型开发过程中也将安全性放在了首位。Llama 3.3 采用了强有力的拒绝策略来应对潜在的有害提示,并在响应中保持了平衡的语气。鼓励开发人员将其部署在包含了安全保障措施的人工智能系统中,例如 Meta 的 Prompt Guard 和 Code Shield 等,以增强安全性。


该版本在社区中引发了关于其实际潜力的深刻讨论。Bulcode 首席执行官 Mihail Shahov 强调了 Llama 3.3 等紧凑型机型在企业应用中日益重要的作用:


像 Llama 3.3 这样较小的模型在企业级应用程序中无疑是越来越受欢迎了,特别是对于那些需要效率、成本效益和快速部署的任务来说。它们的适应性使其非常适用于客户服务、个性化和轻量级分析等用例——在这些场景中,速度和可负担性往往比对极端深度的需求更重要。


从长远来看,我认为混合方法将会成为常态:紧凑型模型处理大多数日常工作负载,而较大的模型则用于应对小众、高复杂性的挑战。归根结底,这是关于将工具与任务相匹配的问题——紧凑型模型用于可扩展性和可访问性,大模型用于突破性创新。


同样,CloudAngles 的首席执行官 Revathipathi Namballa 分享 了他们组织采用 Llama 3.3 的计划:


这是个好消息。在 CloudAngles,我们已经成功地将我们的 mlangles AI 平台与 Llama 3.2 集成在了一起。随着 3.3 版本的发布,我们已经为部署此升级做好了充分的准备来使我们的客户受益。


非常感谢整个 Meta 团队,感谢他们在推动人工智能创新方面所做出的卓越努力,并使这些进步变得触手可及,以便我们能够探索新的可能性。


该模型可在 Llama 3.3 社区许可证 下访问,检查点托管在 Hugging Face 上。开发人员可以使用诸如 Transformers 之类的流行框架来运行该模型,并利用量化版本来降低硬件需求。Meta 邀请社区提供反馈,以完善未来的迭代并推进人工智能安全标准。


更多详细信息可以在 Llama 3.3 的存储库中找到。

作者介绍


Robert Krzaczyński 是一名专门研究微软技术的软件工程师。他每天主要使用.NET 开发软件,但他的兴趣远不止于此。除了核心专业知识外,Robert 还对机器学习和人工智能有着浓厚的兴趣,不断扩展他自己在这些前沿领域的知识。他拥有控制工程和机器人工程学士学位和计算机科学硕士学位。


原文链接:

https://www.infoq.com/news/2024/12/meta-releases-llama-3/


2025-01-03 12:0013659

评论

发布
暂无评论

另一个CI/CD构建工具

weichenqi

DevOps 云原生 运维平台

优雅!用了这两款插件,我成了整个公司代码写得最规范的码农

AI乔治

Java 架构 面试 IDEA java代码规范

当Serverless遇到Regionless:现状与挑战

华为云开发者联盟

云原生 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

DevData Talks | 思码逸陆春蕊:研发效能度量落地的难点与计策

思码逸研发效能

研发效能

为什么老有人想让我们“程序员”失业? | 社区征文

坚果

三周年征文

华为云网站安全解决方案助力企业腾“云”驾“务”

YG科技

外译笔记 | 比尔盖茨:AI与智能手机和互联网一样具有革命性

京东科技开发者

AI 京东云 企业号 5 月 PK 榜

Android App开发超实用实例 | ​Broadcast

TiAmo

broadcast broadcastreceiver Android APP

All in AI,现在开始算不算太晚?

Baihai IDP

人工智能 AI 企业号 5 月 PK 榜 人工智能浪潮

RabbitMQ - 1消息队列中间件AMQP协议、和主要角色

Java你猿哥

Java ssm AMQP Rabbit MQ

kafka高性能设计之内存池

Java你猿哥

Java kafka ssm 架构师 内存池

Spring Data JPA:轻松实现数据持久化

Java你猿哥

Java spring ssm spring data

多位P8大佬联合打造的Java面试八股文,堪称《Java驾考宝典》

Java你猿哥

Java MySQL redis spring 多线程

玩转服务器之Java Web篇:手把手教你搭建Java Web环境 | 京东云技术团队

京东科技开发者

Java 云服务器 京东云 企业号 5 月 PK 榜

几种常见的Python数据结构

华为云开发者联盟

Python 开发 华为云 华为云开发者联盟 企业号 5 月 PK 榜

惊艳的数据可视化案例 让可视化设计灵感迸发

2D3D前端可视化开发

数据分析 数据可视化 数据可视化工具 前端数据可视化 数据可视化设计

什么是人工智能领域的过拟合和欠拟合

汪子熙

人工智能 机器学习 深度学习 强化学习 三周年连更

极光笔记 | 极光推出“运营增长”解决方案,开启企业增长新引擎

极光JIGUANG

营销 运营 用户运营

和写作谈谈感觉,你也许可以这样做。

叶小鍵

试用「ChatGPT」几周之后

人工智能 ChatGPT

Spring Boot:MyBatis分页

Java你猿哥

Java spring Spring Boot mybatis ssm

华为云网站安全解决方案一站式护航

YG科技

守护企业网站安全!选择华为云网站安全方案更准

YG科技

华为云网站安全解决方案:让企业上云后无忧开展网站业务

YG科技

mosn基于延迟负载均衡算法——走得更快,期待走得更稳 | 京东云技术团队

京东科技开发者

负载均衡 京东云 企业号 5 月 PK 榜

全网好评!程序员面试必备的Java八股文,适合所有的Java求职者!

Java你猿哥

Java Spring Boot 多线程 java基础 Java八股文

耗时15天,我把“大厂面试指南”进行了重新梳理,V2.0版已上线

Java你猿哥

Java 数据库 计算机 java面试 java基础

浪潮信息 KOS 助力企业核心业务完成 CentOS 迁移替换,性能提升 10%|龙蜥案例

OpenAnolis小助手

操作系统 开源社区 CentOS迁移 浪潮信息 龙蜥案例

京东APP百亿级商品与车关系数据检索实践 | 京东云技术团队

京东科技开发者

数据库 京东云 企业号 5 月 PK 榜

京东小程序折叠屏适配探索 | 京东云技术团队

京东科技开发者

京东云 企业号 5 月 PK 榜 京东小程序

Meta 发布 Llama 3.3:一个性能和效率均有所提升的多语言模型_AI&大模型_InfoQ精选文章