首页> 中文学位 >基于多核处理器串行程序并行化改造和性能优化
【6h】

基于多核处理器串行程序并行化改造和性能优化

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1引言

1.2本课题的研究背景

1.2.1多核的研究现状和发展

1.2.2多核的应用领域

1.2.3课题的研究现状

1.2.4课题的研究意义

1.3本课题的并行化模型工具

1.3.1并行模型TBB

1.3.2并行支持工具Intel工具

1.4本设计的预期目标和主要工作内容

1.4.1预期目标

1.4.2主要工作内容

1.4.3课题的难点

1.4.4课题的创新点

1.5本章小结

第2章系统总体设计

2.1多核开发平台

2.1.1硬件开发平台——多核处理器

2.1.2软件开发平台

2.1.3系统验证平台

2.2总体设计

2.2.1系统分析

2.2.2并行化开发运行时库的选择

2.2.3并行化开发工具的选择

2.2.4系统开发模型的建立

2.2.5系统开发步骤

2.3本章小结

第3章串行程序可并行化分析

3.1串行程序的结构特征

3.1.1串行程序总体架构

3.1.2串行程序的功能

3.1.3串行程序的并行化条件

3.1.4串行程序的并行化可能性

3.2 Vtune性能分析解决方案

3.2.1 Vtune采样分析

3.2.2 Vtune调用图分析

3.3串行程序的并行化分析

3.3.1串行程序的存储结构

3.3.2串行程序的循环并行化分析

3.3.3串行程序的任务级别划分分析

3.4串行程序的并行化分析总体解决方案

3.5本章小结

第4章并行化改造的设计实现

4.1传统解决方案

4.1.1 Raw thread解决方案

4.1.2 OpenMP解决方案

4.2开发平台

4.2.1 TBB介绍

4.2.2并行环境构建

4.2.3并行设计模型整体架构

4.3流程机制的并行化改造实现

4.3.1 TBB/pipeline流程机制设计

4.3.2 TBB/filter设计

4.4粒度划分和循环并行化实现

4.4.1 parallel_for循环并行化设计

4.4.2 blocked_range/blocked_range2d并行粒度划分设计

4.4.3粒度的划分实验

4.5内存并行化设计

4.6任务级并行化实现

4.6.1 TBB/scheduler_init任务调度设计

4.6.2 TBB/task设计

4.7并行时间计时实现

4.8并行结果和性能初步评测

4.9并行结果分析

4.10本章小结

第5章并行化程序调试和优化

5.1优化程序多核平台的建立

5.2调试

5.2.1 Checker分析

5.2.2数据竞争问题的解决方案

5.3 Intel C++Complier编译优化

5.3.1 Intel C++Complier对串行程序的优化

5.3.2 complier c++对并行程序的优化

5.4 Intel thread profiler优化

5.4.1 profiler分析

5.4.2负载均衡的解决方案

5.4.3加锁解锁性能影响的解决方案

5.5本章小结

第6章分析结果总评测

6.1与串行程序的对比评测

6.2对评测结果的分析

6.3本章小结

结论

致 谢

攻读硕士学位期间发表的论文

参考文献

展开▼

摘要

早期并行程序的开发基本应用在超级计算、高端服务器等特殊应用领域。随着Intel和AMD多核处理器市场占有率的上升,通过提高CPU频率来提升程序性能的时代即宣告结束。但是重新开发适应多核平台的应用程序不仅浪费以往的大量串行程序资源,同时也无法在短期内满足用户需求。因此多核开发从早期的专用领域开发延伸到多核通用领域并行改造。这里的多核通用平台的并行改造是指基于通用PC机开发环境即Windows操作系统+Intel多核处理器,将以往的大量的普通串行程序进行并行改造,实现正确、高性能和可扩展的多核程序开发。多核通用平台开发不同于传统的并行开发在于其平台的通用性、开发周期的快速性和系统级配套辅助工具的使用等方面。 为此,本文针对多核通用开发,基于Windows+Intel开发平台,运用并行编程模型和方法,结合使用Intel Vtune Performance Analyzer(性能分析器)对一串行程序进行并行化分析,提出对串行程序进行并行改造的解决方案;接着运用Intel并行时库TBB(Intel Thread Building Blocks线程构建模块)对多核平台下的串行应用程序进行流程机制、循环并行化、粒度划分、内存分配和任务调度等方面的并行改造;最后运用Intel Thread Checker(线程检查器)、Intel Thread Profiler(线程直方统计器)对改造后的并行程序进行调试和优化;通过对改造后的程序评测,其性能得到一定程度的提高,具有负载均衡和正确性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号