写点什么

Arm 发布全新 Armv9 边缘 AI 计算平台,可运行超 10 亿参数端侧 AI 模型

  • 2025-03-06
    北京
  • 本文字数:1304 字

    阅读完需:约 4 分钟

大小:738.75K时长:04:12
Arm发布全新Armv9边缘AI计算平台,可运行超10亿参数端侧AI模型

近日,Arm 正式发布了其全球首款 Armv9 边缘 AI 计算平台。据介绍,该平台以全新的 Arm Cortex-A320 CPU 和边缘 AI 加速器 Arm Ethos-U85 NPU 为核心,可支持运行超 10 亿参数的端侧 AI 模型。

Cortex-A320 与 Ethos-U85 的深度配合


全新发布的 Arm Cortex-A320 是 Arm 首款基于 Armv9 架构的超高能效 CPU,专为物联网应用优化,也是该全新计算平台的核心组件。与上一代 Cortex-A35 相比,Cortex-A320 在机器学习(ML)计算能力上提升了 10 倍,标量计算性能提高了 30%。同时其能效比较 Cortex-A520 提升了 50%。此外,Cortex-A320 支持四核共享集群,可根据不同需求灵活扩展,满足各种应用场景的需求。

 

作为此次边缘 AI 计算平台的另一核心,对 Transformer 网络具有原生支持的 Ethos-U85 NPU 是 Arm Ethos-U 产品线中的第三代 NPU。与前一代产品相比,该 NPU 的性能提升了四倍,能效提高了 20%,并且可在主流网络上实现高达 85%的利用率。

 

Cortex-A320 CPU 和 Ethos-U85 NPU 实现了深度配合:Cortex-A320 可以为 Ethos-U85 提供更高的内存容量与带宽,让大模型在 Ethos-U85 上的执行如虎添翼;任何开发者们不希望在 Ethos-U85 上运行的 AI 操作,可以回退到 Cortex-A320,利用其 Neon/SVE2 引擎更灵活有效地在 CPU 上执行。这使智能物联网与消费类电子生态系统能够在正确的时间,并在合适的地方运行最适合的工作负载。

 

与去年发布的基于 Cortex-M85 搭配 Ethos-U85 的平台相比,全新 Armv9 边缘 AI 计算平台的 ML 计算性能提升了 8 倍,带来了显著的 AI 计算能力突破,助力大模型与生成式 AI 在物联网领域的落地。

安全性增强与 AI 计算优化


值得一提的是,Cortex-A320 充分利用了 Armv9 增强的安全性和 AI 计算特性,这些特性此前已经在其他市场得到广泛应用,而 Arm 现在也将其引入物联网领域。

 

在安全性方面,Cortex-A320 引入了 Secure EL2,该特性增强了 TrustZone 内部的隔离性,支持更安全地运行软件容器;指针验证/分支目标识别(PACBTI)可有效缓解跳转和返回编程中的指针安全隐患;内存标记扩展(MTE)可通过内存标记机制,使黑客更难利用漏洞进行攻击,提高整体系统安全性。

 

在 AI 计算能力方面,增强的 Neon 和可伸缩向量扩展(SVE2)技术,可提供更高效的 ML 计算能力;支持 BFloat16 等新数据类型,提高了 AI 计算的精度和能效;而新增的矩阵乘法指令,优化了 AI 和 ML 计算性能,加速神经网络推理和训练任务。

 

去年,Arm 推出了 Kleidi 软件库,并将其引入了智能手机和服务器市场,它包含优化 AI 负载在 Arm CPU 上执行的 KleidiAI 和加速机器视觉的 KleidiCV。现在,Arm 将 Kleidi 扩展到了物联网。KleidiAI 是一套专为 AI 框架开发者设计的计算内核,让开发者可以无缝地在 Arm CPU 上获取最佳性能。它支持如 Neon 和 SVE2 等 Armv9 架构的关键特性,大幅提升了 AI 的计算效率。此外,KleidiAI 已经集成到多个主流 AI 框架,包括 Llama.cpp、ExecuTorch 和 LiteRT(通过 XNNPACK),可加速 Meta Llama 3 和 Phi-3 等主流 AI 大模型,进一步释放 AI 计算性能。

 

从 AI 发展初期开始,Arm 技术一直推动着边缘智能创新的发展轨迹。此次发布的全新 Armv9 边缘 AI 计算平台可覆盖多个应用场景,实现包括视觉和自然语言在内的多模态的环境感知与理解,进而运行智能体 AI、自主规划、执行复杂任务。展望未来,Arm 全新的边缘 AI 计算平台对物联网生态系统带来的影响值得期待。

 

2025-03-06 11:4610666
用户头像
李冬梅 加V:busulishang4668

发布了 1205 篇内容, 共 828.5 次阅读, 收获喜欢 1312 次。

关注

评论

发布
暂无评论

AI 真的懂你问的问题吗?

Immerse

启动!南宁城投集团携手用友共建全球领先智能化财务共享平台

用友BIP

AI 企业数智化 用友BIP 财务共享

人工智能丨2025年,测试从业者应如何拥抱智能体(AI Agent)?

测试人

淘宝天猫宝贝详情优惠券数据采集接口:深入探究与实践

tbapi

淘宝API 淘宝优惠券接口 淘宝商品优惠券接口 天猫优惠券接口

无刷电机工厂生产管理MES系统解决方案

万界星空科技

无刷电机 mes 制造业工厂 电机行业 电机MES

签约+战略合作!水电五局与用友擘画工程项目管理数智新蓝图

用友BIP

数智化 用友BIP 企业AI 企业管理工程

AI口语练习APP的接口优化

北京木奇移动技术有限公司

软件外包公司 AI口语练习 AI英语学习

巧用输出变量,提升Dolphinscheduler工作流灵活性和可维护性

白鲸开源

开源 大数据任务调度 Apache DolphinScheduler

人工智能丨测试人必看!MCP协议如何让测试工具“智商”翻倍?

测试人

人工智能

DeepSeek将如何改变我们的日常生活和工作?

天津汇柏科技有限公司

AI 人工智能 DeepSeek

超 400 人团队律所,如何用 NocoBase 高效管理律师提成?

NocoBase

开源 零代码 客户案例 薪酬绩效管理 律师事务所

90%企业踩坑的数据管道管理问题,4大技术方案实现效率翻倍!

白鲸开源

开源 技术方案 Apache DolphinScheduler

智能制造:关于专精特新的解读

积木链小链

数字化 智能制造

蚂蚁集团在加速互联网和金融服务创新上的实践——平台工程解决方案

蚂蚁开源

蚂蚁集团 kusionstack 蚂蚁开源

物资管理系统(源码+文档+讲解+演示)

深圳亥时科技

淘宝天猫宝贝详情页面商品评论采集接口全解析

tbapi

淘宝商品评论接口 淘宝API 淘宝评论接口

AI赋能时尚零售功能篇:全渠道全流程商品管理数字化

第七在线

【IoTDB 线上小课 13】包教包会的 IoTDB 安装教程来啦!

Apache IoTDB

BOE(京东方)携前沿显示技术亮相ICDT 2025 “绿色+科技”引领产业持续向新

爱极客侠

云报工系统(源码+文档+讲解+演示)

深圳亥时科技

人工智能产品测试 | 特征的概念:离散与连续

测试人

人工智能

CST软件如何理解远场的坐标、分量和极化

思茂信息

cst电磁仿真 CST软件 CST Studio Suite

轻帆云荣获“智慧商业数字化运营优秀服务商”奖项,AITSM赋能零售新未来

云智慧AIOps社区

ITSM ITSM软件 工单管理 工单系统 工单处理

企业AI 智启新底座,共探AI与数智化底座的融合创新路径

用友BIP

数智化 用友BIP 企业AI

2025大型企业财务数智化峰会·上海站圆满落幕!

用友BIP

数智化 用友BIP AI+财务

深入理解 Bitmap 索引:原理、场景与应用案例

镜舟科技

数据分析 OLAP 分析型数据库 StarRocks Bitmap 索引

AI技术赋能企业财务管理,用友BIP创新五大智能财务场景

用友BIP

AI 数智化 企业财务 用友BIP 财务智能体

AI口语练习APP的性能测试

北京木奇移动技术有限公司

软件外包公司 AI口语练习 AI英语学习

AI Agent赛道:昙花一现还是生态革命?6大咖拆解泡沫与未来

TechubNews

AI Agents 币圈不设防

烟草业需要用到堡垒机的几个情形简单说明

行云管家

网络安全 数据安全 堡垒机

充电桩测试系统(源码+文档+讲解+演示)

深圳亥时科技

Arm发布全新Armv9边缘AI计算平台,可运行超10亿参数端侧AI模型_芯片&算力_李冬梅_InfoQ精选文章