首页> 中文会议>第十七届计算机工程与工艺年会暨第三届微处理器技术论坛 >面向多核向量处理器的基4FFT向量化设计与实现

面向多核向量处理器的基4FFT向量化设计与实现

摘要

本文提出一种将基4FFT算法映射到Matrix多核向量处理器的向量化方法.针对Matrix体系结构的特点,将FFT算法的混洗需求和访存请求融合,减少了混洗模式;并通过软件流水的方法充分挖掘了Matrix的指令级和数据级并行性,从而有效地提高了FFT的计算性能.实验结果表明,提出的双精度浮点基4FFT向量化方法取得较高的性能,相比TIC6713、4096点的基4FFT平均加速比为92.6.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号