首页> 中文学位 >低功耗低成本嵌入式处理器媒体扩展单元设计
【6h】

低功耗低成本嵌入式处理器媒体扩展单元设计

代理获取

目录

文摘

英文文摘

致谢

图表目录

第1章 绪论

1.1 研究背景与意义

1.2 多媒体扩展技术的发展与研究现状

1.2.1 专用多媒体处理器

1.2.2 多媒体扩展指令集的RISC嵌入式处理器

1.2.3 多核多媒体处理器

1.3 论文的研究基础

1.4 论文研究内容和组织结构

第2章 通用多媒体指令实现研究

2.1 典型多媒体运算

2.2 典型多媒体扩展指令集

2.3 基于CKcore的低功耗成本多媒体扩展指令集

2.4 本章小结

第3章 基于SIMD的低功耗低成本并行技术研究

3.1 SIMD技术相关研究

3.2 低功耗低成本SIMD运算的具体实现

3.2.1 CKcore EV算术逻辑单元研究

3.2.2 SIMD算术逻辑单元的设计实现

3.2.3 SIMD算术逻辑单元的时延分析及改进

3.3 本章小结

第4章 高速树形结构乘法单元设计研究

4.1 传统进位链乘法器算法分析

4.2 四叉树型快速乘法器算法研究

4.3 四叉树型快速乘法器的逻辑实现

4.4 基于四叉树结构的多媒体乘法单元实现

4.5 多媒体乘累加单元的加速算法实现

4.6 本章总结

第5章 多媒体辅助逻辑设计研究

5.1 媒体扩展单元乱序执行技术研究

5.2 媒体扩展寄存器和回写逻辑相关技术研究

5.3 本章小结

第6章 基于多媒体运算特性的低功耗技术

6.1 低功耗相关技术

6.2 多媒体SIMD通路低功耗控制

6.3 基于结果推测的低功耗控制

6.4 多媒体动态调度低功耗控制

6.5 本章小结

第7章 总结与展望

7.1 论文研究工作总结

7.2 今后工作的展望

参考文献

作者简介

作者攻读硕士学位期间发表的论文

展开▼

摘要

随着嵌入式系统中对于音视频处理、图像识别、3D模拟等多媒体相关应用的日益增多,高效低成本低功耗的多媒体扩展单元将成为未来通用嵌入式处理器的关键部件。本文围绕多媒体扩展单元的架构设计,重点研究合理有效利用现有资源,提升多媒体运算性能,降低硬件开销,减小功耗损失等关键技术。本文的主要研究内容和创新点包括:
   ⑴隔离式SIMD算术单元及其高效资源复用技术。提出了隔离位拼接操作数实现快速SIMD执行的算法,并以此进行高效资源复用和时延控制的SIMD算术单元设计。该方法通过扩展原整型加法器宽度,插入隔离位分隔SIMD各操作数,仅增加少量选择逻辑,实现了SIMD运算对原有整型通路的高效复用,同时采用逆向移位的操作数准备和封装方案,解决了关键路径问题,以极小的硬件代价实现了对多媒体SIMD加速操作的支持。
   ⑵树型快速乘法/乘累加单元及SIMD分支提取和延迟旁路技术。首先根据传统阵列乘法器的缺点,分析提出了四叉树型快速乘法器的原理和实现算法,然后在此基础上设计多媒体乘法和乘累加的流水执行单元。根据树型结构的特点,提出分支提取技术实现SIMD运算的高效复用技术,仅增加少量判断选择逻辑,实现了同一乘法器对SIMD运算的支持;同时通过分析MAC指令流的依赖关系,提出了延迟旁路动态调度技术减少累加操作数的相关代价,降低执行停顿,以增加少量旁路逻辑获取MAC指令流性能的大幅提高。
   ⑶复用式多媒体保留栈动态调度技术及媒体寄存器组框架。通过复用多媒体运算中较少使用的执行单元保留栈,组成更大深度的多媒体保留栈,增加少量控制逻辑,实现了更强的多媒体动态调度性能。对于双字结果的多媒体运算,利用原有重排序缓存资源,增加独立多媒体寄存器组与之配合使用,并复用公共数据总线和退休回写硬件资源,以较少的硬件代价实现了对高位宽数据回写的支持。
   ⑷基于多媒体运算特征的精细低功耗控制技术。基于SIMD运算特性的低功耗技术,对于每一个子通路进行独立控制,在没有对应运算时彻底关闭该通路以降低功耗;基于结果推测的低功耗技术,对于某些可提前确定结果的多媒体运算,采用旁路逻辑回写最终结果,关闭整个数据通路减少冗余功耗;多媒体动态调度低功耗技术,对复用式保留栈和独立寄存器组根据其写入特点进行独立化和精细化的功耗控制,在没有写入和清除操作时关闭响应时钟以减少动态功耗。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号