基于GPU的隐式算法与方案研究

摘要

图形处理单元(GPU)可以将桌面计算机的计算速度提高1~2个数量级经典,发展相关的隐式算法非常重要。本研究根据GPU的硬件特点,选择了DP-LUR 隐式方法,并对此进行了进一步的改进。根据GPU 算法低内存需求,首先对DP-LUR 方法右端项相关矩阵运算进行改写,将其变化为具有推广价值的标量形式。这一改进与原始方法完全等价,但形式极为简洁,节省了大量的内存存储与读写需求。随后,进一步将左端项矩阵对角化,从而对内存存储与读写的需求进一步降低,同时降低了单步迭代计算量,但也同时降低了收敛速度,总计算量比前一种方法增加了约20%。以上两种改进相互独立,可以根据需要单独或联合选取。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号