TRIPS上的矩阵乘法性能分析

摘要

以TRIPS为代表的分片式结构是未来通用微处理器设计的可选方案之一.TRIPS采用细粒度推测多线程的方法,极大地开发了程序运行时的片内并行性,力图为各种类型的应用提供一个统一高效的实现平台.但运行稠密数值运算时,由于数据存放位置与指令调度的不合理,TRIPS不能发挥其结构优势.本文在一个经过时钟精确性验证的TRIPS模拟器上运行小规模稠密矩阵乘法,通过调整模拟器的各种结构参数获得不同配置下的程序性能,并通过对这些实验结果的分析,得到了TRIPS执行此类应用遇到的性能瓶颈.同时,本文针对这些瓶颈提出了调整TRIPS的存储模型和改进指令调度器等优化方法,以提高运行稠密数值运算的程序性能.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号