基于Stencil算法的NVIDIA Kepler架构下的性能分析与调优

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在很多计算密集的应用中，Stencil算法（模板计算）是耗时最多和最为重要的计算核心。随着GPU通用计算加速卡出色的计算能力、功耗控制和编程的简化，GPU加速卡在科学研究中的工作站和超级计算机中得到普遍使用，如何在GPU这样的异构设备上将Stencil算法进行性能优化和提高效率便成了一个亟待解决的关键问题。在本文中，我们选取了3D7P这个典型应用进行研究。通过对这个典型应用在Kepler架构GPU上的优化和分析，我们探讨了不同优化手段对于计算性能产生的影响。NVIDIA Kepler架构是Tesla系列服务器级GPU中最新的架构，我们研究了Tesla K20、K40、K80，基本涵盖了Kepler架构的绝大部分核心。并借助性能分析工具——nvprof，通过收集程序执行中的硬件指标和性能事件，对Stencil计算在不同优化手段下性能的差异进行了比较和分析。对于访存受限类型的3D7P程序在不同的Tesla GPU上，经过性能调优后访存带宽基本达到了对应的实际带宽峰值。本文还对嵌入式开发板NVIDIA Jetson TX1进行了研究和分析。TK1是首个在嵌入式集成了Kepler核心GPU的开发板，而TX1是TK1的升级，其集成了NVIDIA最新Maxwell架构核心，并且拥有完整的CUDA开发平台。比较TX1和Kepler GPU的性能差异对我们深入了解Kepler架构和Maxwell架构对有重要的借鉴意义。同时也为我们以后研究Maxwell架构下的服务器级GPU性能分析与调优提供了参考。

著录项

作者
李文强;
展开▼
作者单位

上海交通大学;

展开▼
授予单位上海交通大学;
学科计算机技术
授予学位硕士
导师姓名李明禄;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.52;
关键词
嵌入式开发板; Stencil算法; Maxwell架构; GPU加速卡;

相似文献

中文文献
外文文献
专利

1. 校正源条件下基于双星序列观测量的地面运动目标定位算法及理论性能分析 [J] . 王鼎 ,张莉 ,吴瑛 . 通信学报 . 2015,第010期
2. 四阶模型下基于 IMMKF 的定位算法与性能分析 [J] . 肖宁 ,王玫 ,雷延锋 . 计算机应用与软件 . 2014,第003期
3. 基于门限的漏桶算法在突发业务下的性能分析 [J] . 陈惠芳 ,谢磊 . 浙江大学学报：自然科学版 . 1999,第005期
4. 基于CUDA架构下的直方图均衡并行算法 [J] . 肖汉 ,肖诗洋 ,孙陆鹏 . 桂林理工大学学报 . 2021,第003期
5. 基于微服务架构下题库系统智能组卷算法应用的研究 [J] . 周艺伟 ,洪逸凡 . 电脑知识与技术 . 2020,第024期
6. 多核与众核架构下对不同Stencil的性能优化和分析 [C] . XU Yang-Tong ,徐阳彤 ,付昊桓 . 2013全国高性能计算学术年会 . 2013
7. 基于3D-EW算法的Intel KNC架构下的性能分析与调优 [A] . 王一超 . 2015

基于Stencil算法的NVIDIA Kepler架构下的性能分析与调优

目录

摘要

著录项

相似文献

相关主题

期刊订阅