首页> 中文学位 >基于FPGA的矩阵奇异值分解加速方案的设计与实现
【6h】

基于FPGA的矩阵奇异值分解加速方案的设计与实现

代理获取

目录

声明

致谢

摘要

1.1 研究背景与意义

1.2 研究现状

1.3 论文研究内容

1.4 论文组织结构

1.5 本章小结

2 矩阵奇异值分解算法原理与分析

2.1 矩阵奇异值分解

2.2 矩阵奇异值分解的Jacobi变换算法

2.2.1 Jacobi算法基础知识

2.2.2 双边Jacobi变换算法

2.2.3 单边Jacobi变换算法

2.3 列对索引序列

2.4 基于FPGA的单边Jacobi变换奇异值分解算法并行化分析

2.5 本章小结

3 矩阵奇异值分解硬件架构设计

3.1 基于片上存储器和循环序列单边Jacobi算法的SVD电路设计

3.1.1 基于循环序列单边Jacobi变换算法优化

3.1.2 基于循环序列单边Jacobi变换算法的加速电路顶层设计

3.1.3 矩阵奇异值分解硬件加速电路主要功能模块设计实现

3.2 基于片上存储器指环序列的单边Jacobi变换算法的SVD加速电路

3.2.1 基于指环序列的单边Jacobi算法并行化分析

3.2.2 基于指环序列的单边Jacobi算法硬件加速电路设计

3.3 基于外存储器的指环序列单边Jacobi算法SVD硬件电路设计

3.3.1 硬件加速电路顶层设计

3.3.2 基于外存储器的数据缓存策略设计

3.4 本章小结

4 基于FPGA平台的矩阵奇异值分解硬件加速器实现

4.1 基于FPGA的异构计算平台

4.2 基于片上存储单边Jacobi算法的电路实现以及性能与资源分析

4.2.1 基于不同平台循环序列单边Jacobi算法的性能对比分析

4.2.2 基于循环序列和指环序列的单边Jacobi算法硬件实现对比

4.3 基于片外存储环序列的单边Jacobi算法硬件电路性能与资源分析

4.4 基于片上存储与基于片外存储方式的奇异值分解对比分析

4.5 本章小结

5 结论与展望

参考文献

作者简历及攻读硕士学位期间取得的研究成果

学位论文数据集

展开▼

摘要

奇异值分解(singular value decomposition)是数值计算学科中的一个重要组成,并且在诸如无线通信领域的大规模MIMO、图像处理领域的特征提取及主成分分析、机器学习领域的数据压缩、词义索引和大数据领域的数据相关性分析中都发挥着至关重要的作用。奇异值分解算法是计算复杂度相对较高的矩阵分解算法,而且随着数据处理规模的不断增加,无论在通信方向的大规模MIMO中,还是对于矩阵维度及数据量都更加庞大的图像及数据挖掘等研究与应用场景中,对于奇异值分解的运算速度都有越来越高的需求,因此对矩阵奇异值分解的加速方案实现具有很高的研究与应用价值。
  本文重点研究了基于单边Jacobi方法的矩阵奇异值分解,该算法具有相对精度高、分解速度快的特点,是一种非常适合并行化和大规模矩阵计算的一种旋转运算方法。对于Jacobi算法而言,旋转变换和列对排序对分解的速度有决定性作用,本文对不同的矩阵列对索引方式进行了研究,并将两种序列生成方式,循环序列和指环序列应用到硬件设计当中。其中指环序列的列对排序方式,不仅利于并行化实现,而且可以得到有序排列奇异值矩阵,并对算法的收敛速度也有积极的促进作用。
  针对实时性、低延迟需求,本文提出了基于片上存储的循环序列单边Jacobi变换算法硬件架构,其性能相比于相同算法的MATLAB方案和GPU方案有很明显加速效果,保持了相当的数值精度。在此基础上,设计实现了一种基于片上存储以及指环序列方式的并行化硬件加速方案,相比于循环序列方式,实测加速比达到2.95倍。其次,针对大规模、高吞吐率的图像处理以及数据挖掘等应用场景,为解决片内存储容量与硬件设计复杂的问题,提出了基于片外存储器和指环序列的单边Jacobi算法的并行架构设计,并且基于性能与资源的关系,提出了其在并行化硬件设计上性能与资源的平衡策略。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号