首页> 中文会议>2012全国高性能计算学术年会 >基于OpenCL的连续数据无关访存密集型函数并行与优化研究

基于OpenCL的连续数据无关访存密集型函数并行与优化研究

页面导航

摘要
著录项
相似文献
相关主题

摘要

连续的数据无关是指计算目标矩阵连续的元素时使用的源矩阵元素之间没有关系且也为连续的,访存密集型是指函数的计算量较小,但是有大量的数据传输操作.本文在OpenCL框架下,以bitwise函数为例,研究和实现了连续数据无关访存密集型函数在GPU平台上的并行与优化.在考察了向量化、线程组织方式和指令选择优化等多个优化角度在不同的GPU硬件平台上对性能的影响之后,实现了这个函数的跨平台性能移植.实验结果表明,在不考虑数据传输的前提下,优化后的函数与这个函数在OpenCV库中的CPU版本相比,在AMD HD 5850 GPU达到了平均40倍的性能加速比;在AMD HD 7970 GPU达到了平均90倍的性能加速比;在NVIDIA Tesla C2050 GPU上达到了平均60倍的性能加速比;同时,与这两个函数在OpenCV库中的CUDA实现相比,在NVIDIA Tesla C2050平台上,也达到了1.5倍的性能加速.

著录项

来源
《2012全国高性能计算学术年会》|2012年|1-11|共11页
会议地点张家界
作者
JIANG Li-yuan; 蒋丽媛; ZHANG Yun-quan; 张云泉; LONG Guo-ping; 龙国平; JIA Hai-peng; 贾海鹏;
展开▼
作者单位

中国计算机学会;

中国软件行业协会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类 TP391.41;
关键词
图像处理器; 连续数据; 无关访存密集型函数; 性能移植;

相似文献

中文文献
外文文献
专利

1. 基于OpenCL的连续数据无关访存密集型函数并行与优化研究 [J] . 蒋丽媛 ,张云泉 ,龙国平 . 计算机科学 . 2013,第003期
2. 基于OpenCL并行加速的Mean Shift三维体数据分割方法 [J] . 王璟瑞 ,高锐 ,邱焓 . 通信技术 . 2019,第011期
3. NJ-GPCA:一种面向并行空间计算的高效数据访存策略 [J] . 姚晓 ,邱强 ,肖茁建 . 高技术通讯 . 2018,第001期
4. 面向数据流结构的指令内访存冲突优化研究 [J] . 欧焱 ,冯煜晶 ,李文明 . 计算机研究与发展 . 2019,第012期
5. 基于并行优化与访存优化遗传算法的TSP问题求解方法 [J] . 陆游 ,何嘉 . 四川文理学院学报 . 2017,第002期
6. 面向流数据的重排序访存缓冲研究与设计 [C] . 穆长富 ,王玉辉 ,汤明 . 第十一届计算机工程与工艺全国学术年会 . 2007
7. 基于自动访存模式分析的多OpenCL设备共享存储设计 [A] . 陈东 . 2013

基于OpenCL的连续数据无关访存密集型函数并行与优化研究

摘要

著录项

相似文献

相关主题

期刊订阅