写点什么

Arm 推出业内首创的面向 GPU 的“神经技术”,为移动设备注入活力

  • 2025-08-21
    北京
  • 本文字数:2012 字

    阅读完需:约 7 分钟

大小:1.04M时长:06:04
Arm推出业内首创的面向 GPU 的“神经技术”,为移动设备注入活力

在 AI 技术席卷各行各业的今天,移动游戏领域正迎来一场由底层硬件和软件技术共同驱动的深刻变革。从简单的像素渲染到复杂的 AI 驱动角色,再到未来的全路径追踪,游戏体验的边界正被不断拓宽。

 

近日,总部位于英国的计算平台公司 Arm 正式宣布推出面向 GPU 的“Arm 神经技术”(Arm Neural Technology),该技术可将 GPU 工作负载减少一半,并在未来支持其他 AI 功能。Arm 还发布了一款全面开放的神经图形开发套件,方便开发者立即上手。

 

Arm 将神经加速用于在不影响性能的情况下将图形分辨率提升到更高。其他设想的用途包括通过采集连续两帧画面并生成中间帧,直接提升帧率;以及通过在移动设备上以更少的每像素射线实现实时路径追踪来提升图像质量。

 

这一技术的发布被视为 Arm 移动图形战略的又一重要里程碑,不仅能够为移动端带来媲美桌面的神经渲染能力,还将在游戏和 AI 的深度融合中发挥关键作用。Arm 终端事业部产品管理总监 Steve Steele 对该技术的相关背景、技术原理及未来路线图进行了详细解读。

 

Steve Steele 表示,多年来,AI 一直是移动端体验的核心组件,从摄像头创新到生成式 AI 应用,再到手游中的 NPC 控制与语音交互,都离不开 AI 的支撑。这些体验的实现依赖于 CPU、GPU 和 NPU 的协同工作,而 Arm 始终致力于以高能效方式运行 AI,降低开发者使用门槛。​

 

行业的关键挑战在于平衡硬件差异化与软件一致性。为此,Arm 去年推出 Arm KleidiAI 软件库,确保 CPU 能为多数 AI 算法提供足够性能,避免开发者因软件栈效率问题被迫依赖 GPU。但当 AI 需与图形管线深度结合时,GPU 的作用不可或缺。尤其在亚太市场,《王者荣耀》、《崩坏:星穹铁道》等手游对图形性能要求严苛,推动着 Arm 不断突破移动端图形技术极限。​

 

从 2022 年的光线追踪、可变速率着色,到 2023 年的延迟顶点着色,再到 2024 年的 Arm 精锐超级分辨率技术(Arm ASR),Arm 持续提升图形处理能力。如今,Arm 神经技术的推出,标志着移动端 AI 与图形技术的融合进入新阶段。​

Arm 神经技术五大核心亮点


Arm 神经技术并非单一产品,而是一套涵盖硬件、软件与工具的完整解决方案,其核心目标是在降低 GPU 工作负载的同时,提升移动端游戏的画质与流畅度。

硬件层面,神经加速器将深度嵌入 2026 年起的 Arm GPU 中,它并非简单的张量核心,更像是每个着色器中的“迷你 NPU”,能实现低延迟、高效能的 AI 与图形交互,为神经超级采样等算法提供硬件支撑。​

 

软件与工具层面,Arm 同步推出首个全面开放的神经图形开发套件,其中包括虚幻引擎插件、基于 PC 的 Vulkan 模拟、更新的分析工具、通过 GitHub 和 Hugging Face 提供的完全开放的模型,以及面向 Vulkan 的 ML 扩展。开发者可通过虚幻引擎插件快速集成技术,利用开放模型与示例代码进行二次开发,即便在硬件上市前,也能在桌面端完成技术验证。

核心应用场景中,Arm 神经超级采样(Arm NSS)是首个落地的用例。它能以 540p 分辨率渲染游戏,通过 AI 技术输出 1080p 超高质量画面,单帧处理仅需 4 毫秒,相比传统渲染减少 50% GPU 负载。在 SIGGRAPH 大会展示的“魔法城堡”项目中,Arm NSS 在仅渲染四分之一像素的情况下,画质媲美全分辨率渲染,且能耗显著低于桌面级神经优化技术。​

 

此外,神经帧率提升(NFRU)和神经超级采样与降噪(NSSD)两项技术正在开发中。NFRU 可通过生成中间帧将 30 FPS 内容提升至 60 FPS;NSSD 则能为光线追踪内容降噪,仅需发射少量光线即可生成高分辨率无噪点图像,大幅降低路径追踪的计算成本。​

 

生态开放是 Arm 神经技术的另一核心优势。与桌面端不同,Arm 开放了模型架构、权重及工具,开发者可针对独特工作负载优化模型。目前,Epic Games、网易游戏、腾讯游戏等已加入合作,共同完善开发套件。​

 

当被问及 Arm 神经技术与 Arm GPU 如何集成时,Steve Steele 明确表示,神经技术的硬件部分,即神经加速器,深度嵌入在 GPU 中。这意味着可以实现非常低的延迟。同时,AI 和图形之间的接口也能达到极高效且低功耗的表现。


对于“减少 50% GPU 工作负载”的实现方式,他解释道:Arm 神经技术通过仅渲染 25%像素节省大量算力,但需兼顾几何体等因素,因此总体节省 50%负载。开发者可灵活分配这部分资源,或降低功耗,或提升帧率与画质。​

 

未来展望:AI 原生手游推动硬件需求升级​

 

Steve Steele 在总结中表示,Arm 神经技术带来的效率提升是当前市场独有的,它将推动移动图形性能跃上新台阶。

 

随着技术落地,“AI 原生”手游将加速普及,不仅图形渲染更高效,NPC 交互、资源创建等环节也将深度融入 AI,这对硬件的 AI 算力与能效提出了更高要求。​

 

Arm 的应对策略清晰而坚定:通过开放生态让开发者快速落地创新,以神经技术路线图持续迭代硬件,并结合软件工具形成协同优势。正如 Arm 在光线追踪、超级分辨率等技术上的积累,此次神经技术的推出,再次彰显了其引领移动端技术革新的决心。​

 

对于玩家而言,这意味着在不久的将来,手机也能流畅运行媲美主机画质的 3A 手游,续航与发热问题得到显著改善;对于开发者,开放的工具与灵活的技术将降低创新门槛,催生更多突破性游戏体验。

2025-08-21 09:489582
用户头像
李冬梅 加V:busulishang4668

发布了 1223 篇内容, 共 837.5 次阅读, 收获喜欢 1316 次。

关注

评论

发布
暂无评论

快速掌握网站监控关键数据:仪表盘的创建与管理

云智慧AIOps社区

监控 监控宝 监控工具 云智慧 网站监控

科技+卫生=智慧公厕,城市焕然一新!

光明源智慧厕所

智慧城市

低代码引擎动作编排

codebee

低代码

基于数字孪生技术的船舶智能机舱

Openlab_cosmoplat

开源社区 数字孪生 智能制造

StyleGAN 调整面部表情,让虚拟人脸更生动

江户川码农

人工智能 机器学习 图像处理 StyleGAN

快速解决 Linux 内核问题,一站式运维工具 oc-ops 介绍

OpenCloudOS

Linux 开源 操作系统

企业数智化转型不仅是可行的,还是必行!

加入高科技仿生人

人工智能 低代码 制造业 数智化

软件测试/测试开发丨app自动化测试(iOS)元素定位(新手篇)

测试人

软件测试 自动化测试 测试开发

JVM 堆体系结构及其内存调优

Java JVM

专业、简单、稳定,融云重新定义互联网通信云服务

融云 RongCloud

互联网 数字化 办公 泛娱乐 通讯

行云洞见 | 为何都在将研发环境搬上云端?

行云创新

云端IDE 云原生集成开发环境

沐曦与百度飞桨完成兼容性测试,助力计算机视觉应用发展

飞桨PaddlePaddle

小度沈健:以闭环服务赋能场景化智能家居

极客天地

头部险企如何打造低代码数据集市,快速构建指标体系

Kyligence

金融科技 指标体系

Redis连接失败问题排查和解决

初学React useEffect Hook

devpoint

React useEffect

数字孪生的安全挑战和机遇

Openlab_cosmoplat

开源社区 数字孪生

触控板手势增强软件:Multitouch激活版

真大的脸盆

Mac Mac 软件 触控板 触控板增强

老马闲评数字化【4】做数字化会不会被供应商拿捏住

行云创新

云原生 数字化转型 企业数字化

WorkPlus SE专业版即时通讯IM办公平台,赋能中小企业数字化转型

BeeWorks

CCF BDCI“大数据平台安全事件检测与分类识别”赛题,奇点云夺冠

奇点云

数据安全 奇点云 个人信息保护

量化合约对冲交易软件|合约一键跟单社区平台系统开发源码

开发微hkkf5566

类似钉钉和企微的企业IM,为什么说私有化部署是企业更好的选择?

BeeWorks

低内存、高性能,磁盘索引可以这样玩

Zilliz

非结构化数据 Milvus 向量数据库

RabbitMq 环境搭建

流火

分片压缩、分片上传,融云 IM 视频文件高速传输方案

融云 RongCloud

视频 IM 方案

火山引擎EMR StarRocks场景案例分享

字节跳动数据平台

EMR

【被夸爆的教学!】ChatGPT注册全攻略!新手必看!省时省力又省心!

frank

ChatGPT

地表最强AI,GPT-4专治各种不服

引迈信息

AI ChatGPT

Arm推出业内首创的面向 GPU 的“神经技术”,为移动设备注入活力_芯片&算力_李冬梅_InfoQ精选文章