GPGPU性能模型研究

J4 ›› 2013, Vol. 35 ›› Issue (12): 1-7.

• 论文 • 下一篇

GPGPU性能模型研究

王锋，杜云飞，陈娟

（国防科学技术大学计算机学院，湖南长沙 410073）

收稿日期:2013-08-10 修回日期:2013-10-12 出版日期:2013-12-25 发布日期:2013-12-25
基金资助:
国家863计划资助项目（2012AA010903）；国家自然科学基金资助项目（61170049）

Research on GPGPU performance models

WANG Feng,DU Yunfei,CHEN Juan

（School of Computer Science,National University of Defense Technology,Changsha 410073,China）

Received:2013-08-10 Revised:2013-10-12 Online:2013-12-25 Published:2013-12-25

摘要/Abstract

摘要：

GPGPU的发展为并行程序带来了丰富的计算资源，但是对程序优化提出了更高的要求。程序性能模型对定位程序性能瓶颈，指导优化方法，平衡与其他设备的负载等方面起着重要作用。描述了当前性能模型的研究现状，并对其进行分类和分析。总体上性能模型分为基于统计方法的性能模型和性能解析模型，性能解析模型又分为性能度量模型、计算和访存并行性感知的模型和分部件定量分析性能模型。每种模型都给出了优缺点，并且实现了一个基于统计信息的插值性能模型，用于指导负载平衡。最后对存在的问题和未来的挑战进行了阐述。

关键词: GPGPU, GPU, 性能模型

Abstract:

The emerging and the development of the GPGPU afford the massive computation power to the parallel applications. How to use this computation power efficiently relies on the optimization of the applications. The performance models play an important roles on the targeting the performance bottleneck, guiding the optimization strategies, load balancing with other devices, etc. The stateofart of the GPGPU performance model is described, categorized, and analyzed in details. The models are divided into statisticbased curvefitting model and analysis model. The latter one can further be divided into metric model, computation and memory parallel aware model and componentbased quantitative model. The pros and cons of all the models are analyzed, and an interpolation performance model based on statistics is implemented. Finally the unsolved problems and the future challenges are presented.

Key words: GPGPU;GPU;performance model

王锋，杜云飞，陈娟. GPGPU性能模型研究[J]. J4, 2013, 35(12): 1-7.

WANG Feng,DU Yunfei,CHEN Juan. Research on GPGPU performance models [J]. J4, 2013, 35(12): 1-7.

编辑推荐

Metrics

阅读次数

全文

201

HTML			PDF

最新录用	在线预览	正式出版	最新录用	在线预览	正式出版
0	0	0	0	0	201

来源	本网站	其他网站

次数	169	32
比例	84%	16%

摘要

110

最新录用	在线预览	正式出版

0	0	110

	来源	本网站

	次数	110
	比例	100%

[1]	罗婧, 叶志晟, 杨泽华, 傅天豪, 魏雄, 汪小林, 罗英伟, . 研发类GPU集群任务数据集的构建及分析[J]. 计算机工程与科学, 2024, 46(12): 2128-2137.
[2]	毛润泽, 吴子恒, 徐嘉阳, 章严, 陈帜, . DeepFlame：基于深度学习和高性能计算的反应流模拟开源平台[J]. 计算机工程与科学, 2024, 46(11): 1901-1907.
[3]	王宇华, 何俊飞, 张宇琪, 徐悦竹, 崔环宇. DRM:基于迭代归并策略的GPU并行SpMV存储格式[J]. 计算机工程与科学, 2024, 46(03): 381-394.
[4]	刘仲, 李程, 田希, 刘胜, 邓让钰, 钱程东. MVSim：面向VLIW多核向量处理器的快速、可扩展和精确的体系结构模拟器[J]. 计算机工程与科学, 2024, 46(02): 191-199.
[5]	张勇, 张曦, 万云博, 何先耀, 赵钟, 卢宇彤. 非结构有限体积CFD计算的网格重排序优化[J]. 计算机工程与科学, 2022, 44(10): 1721-1729.
[6]	朱浩, 周博洋, 卢雪山, 杜溢墨. OpenCL计算软件栈评估[J]. 计算机工程与科学, 2021, 43(12): 2105-2114.
[7]	罗磊, 陈照云, 王俪璇. 用户QoS感知的GPU集群深度学习任务动态调度[J]. 计算机工程与科学, 2021, 43(08): 1331-1340.
[8]	龚昊, 刘莹, 冯建周, 赵仁良, 冷佳旭, . 基于GPU加速的脉冲多普勒雷达信号处理[J]. 计算机工程与科学, 2021, 43(07): 1141-1149.
[9]	孙兆鹏, 周宽久. 基于PCIe的高性能FPGA-GPU-CPU异构编程架构[J]. 计算机工程与科学, 2021, 43(04): 641-651.
[10]	魏金晖, 李晨, 鲁建壮. 多GPU系统虚实地址转换架构研究[J]. 计算机工程与科学, 2021, 43(02): 228-234.
[11]	张亮, 常旭, 秦志楷, 沈立. 量子线路模拟器QuEST在多GPU平台上的性能优化[J]. 计算机工程与科学, 2021, 43(01): 17-23.
[12]	李荣春，周鑫，潘衡岳，牛新，高蕾，窦勇. 基于GPU的并行Turbo乘积码译码器[J]. 计算机工程与科学, 2020, 42(05): 761-769.
[13]	徐频捷1,2，王诲喆1,2，李策3，唐丹1，赵地1. 基于脉冲神经网络与移动GPU计算的图像分类算法研究与实现[J]. 计算机工程与科学, 2020, 42(03): 397-403.
[14]	左宪禹1,2，张哲1,5，黄祥志4,5，葛强1,2，张理涛3，臧文乾4,5. 一种适用于GPU图像处理算法的合并存储结构[J]. 计算机工程与科学, 2020, 42(02): 197-202.
[15]	王吉军，郝子宇，李宏亮. 3D-MMA:基于3D集成电路的矩阵乘加速结构[J]. 计算机工程与科学, 2019, 41(12): 2110-2118.

GPGPU性能模型研究

Research on GPGPU performance models

PDF

可视化

摘要/Abstract

引用本文

使用本文

相关文章 15

编辑推荐

Metrics

本文评价