封面
声明
目录
中文摘要
英文摘要
第一章 绪论
1.1 课题研究背景及意义
1.2 BLAS函数库的研究现状
1 .3 多核DSP研究现状与发展趋势
1.4 汇编程序优化技术介绍
1.5 算法测试流程
1.6 论文的组织结构
第二章 X-D SP的体系结构和BLAS库简介
2 .1 X-DSP的体系结构
2.2 BLAS库
2.3 本章小结
第三章 BLAS1汇编程序设计与实现
3.1 BLAS1算法概述
3.2 向量范数设计与实现
3.3 矩阵范数设计与实现
3.4 DDOT的设计与实现
3.5 性能测试与分析
3.6 本章小结
第四章 BLAS2汇编程序设计与实现
4.1 BLAS2算法概述
4.2 GEMV的实现
4.3 SUM_MV的实现
4.4 GER的实现
4.5 TRMV的实现
4.6 TRSV的实现
4.7 性能测试与分析
4.8 本章小结
第五章 BLAS2的多核设计与实现
5.1 GEMV的并行性分析
5.2 GEMV的多核设计与实现
5.3 SUM_MV的多核设计与实现
5.4 GER的多核设计与实现
5.5 TRMV的多核设计与实现
5.6 TRSV的多核设计与实现
5.7 性能测试与分析
5.8 本章小结
第六章 结 束 语
6.1 论文工作总结
6.2 后续工作与展望
致谢
参考文献
作者在学期间取得的学术成果
国防科学技术大学;