OpenACC 高性能并行编程:概念与策略 (33):OpenACC 编程工具 3.3.5

阅读数:1 2020 年 1 月 8 日 19:24

OpenACC高性能并行编程:概念与策略(33):OpenACC编程工具 3.3.5

(支持 OpenACC 的性能工具)

内容简介
本书是介绍大规模并行编程 OpenACC 的综合实践性书籍之一。书中前 3 章介绍了 OpenACC 背后的概念和 OpenACC 开发工具;第 4 章至第 7 章带你了解第 1 个真实世界的 OpenACC 程序,并揭示 OpenACC 程序编译背后的魔力,从而引入更多概念;第 8 章至第 10 章涵盖高级主题,例如 OpenACC 的替代方案、底层设备交互、多设备编程和任务并行性;第 11 章和第 12 章探讨了 OpenACC 实现潜在新语言特性的各种研究领域。

支持 OpenACC 的工具包括两个方面:主机侧和设备侧。你已经了解到了,OpenACC 是一个由主机主导的编程模型,设备活动由主机线程触发。一个理想的 OpenACC 性能分析工具,可以收集与主机上 OpenACC 导语实现有关的信息和与设备上 kernel 执行有关的信息,以及与主机和设备之间数据传输有关的信息。很多性能工具支持 CUDA 和 OpenCL,但是只有少量性能工具可以同时提供与主机上 OpenACC 导语执行有关的信息。后者可以与程序源码进行关联,即使在目标(通常是 CUDA 或 OpenCL)未被跟踪或未知的情况下,也可以深入了解程序的执行情况。

本节将介绍三种强大的性能工具,它们可以支持对 OpenACC 主机和设备的活动进行综合分析。首先,NVIDIA 性能分析工具,作为 CUDA 工具包的一部分,专注于面向 CUDA 设备的 OpenACC 卸载的性能测量和分析。其次,Score-P 环境支持多种范例,包括消息传递(例如使用 MPI 实现)和多线程,以及通过 CUDA、OpenCL 和 OpenACC 实现的卸载。当额外的范例和编程模型与 OpenACC 一起使用时,CUDA 工具包是最强大的工具集之一。最后,TAU 性能系统提供了综合性能测量(检测和采样)和混合并行程序(包括 OpenACC)分析的能力。

OpenACC高性能并行编程:概念与策略(33):OpenACC编程工具 3.3.5

购书地址 https://item.jd.com/12596484.html?dist=jd

评论

发布