您现在的位置: 首页> 研究主题> 超标量

超标量

超标量的相关文献在1993年到2022年内共计115篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、贸易经济 等领域,其中期刊论文76篇、会议论文5篇、专利文献1411篇;相关期刊48种,包括计算机工程与科学、计算机工程与应用、计算机学报等; 相关会议5种,包括2009年全国高性能计算学术年会、第九届计算机工程与工艺全国学术年会、第十三届全国信息存储技术学术会议等;超标量的相关文献由191位作者贡献,包括何虎、尹飞、王旭等。

超标量—发文量

期刊论文>

论文:76 占比:5.09%

会议论文>

论文:5 占比:0.34%

专利文献>

论文:1411 占比:94.57%

总计:1492篇

超标量—发文趋势图

超标量

-研究学者

  • 何虎
  • 尹飞
  • 王旭
  • 付家为
  • 周兴铭
  • 多纳尔德·E·沃尔德克
  • 大卫·S·莱文坦
  • 奥伯雷·D·奥格登
  • 杜勇
  • 詹姆斯·A·卡勒
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 刘有耀; 潘宇晨
    • 摘要: 为解决嵌入式领域对处理器不同性能面积的需求,以及对重排序缓冲区阻塞,保留站派遣长短周期指令时导致的吞吐率不平衡及堵塞问题,设计并优化了一种简便配置的参数化流水线超标量处理器。通过定制化流水线中的分支预测,缓存与运算单元,将RISC-V指令划分5大类处理,对不同周期的执行单元采用级联与并行的混合分布方式,将充当排序缓存中的指令再派遣,达到指令暂存和分类执行的目的,使一条不定周期指令可以携带多条单周期指令提交。缓存之间以直连方式进行通信,以避免复杂的公共数据总线以降低时序损耗。实验结果表明,该处理器可以通过配置达到IPC为0.746~1.476之间的性能,平均比同类型处理器IPC提升132.4%。
    • 摘要: Imagination Technologies和晶心科技(Andes Technology)联合宣布:双方合作借助与RISC V兼容的Andes AX45处理器内核,成功测试和验证了IMG B系列图形处理器(GPU)。Andes AX45是一款64位高性能和可配置的超标量中央处理器(CPU)。此次验证合作为AR/VR、车载信息娱乐系统(IVI)、工业和物联网(IoT)产品领域的客户提供了一种经过验证的、完整的解决方案,并为后续的持续测试奠定了基础。
    • 孙彩霞; 郑重; 邓全; 隋兵才; 王永文; 倪晓强
    • 摘要: DMR是由国防科技大学计算机学院自研的一款兼容RISC-V架构的乱序超标量通用处理器核,支持用户态(user-mode)、特权态(supervisor-mode)和机器态(machine-mode)三种特权级模式,兼容RV64G指令集规范,并进行了 自定义向量扩展,虚存系统支持Sv39和Sv48,物理地址为44 b.DMR的单周期整数流水线为12级,指令乱序发射、顺序提交,指令发射宽度为4,实现了多个分布式调度队列,每拍最多可乱序调度9条指令执行.DMR采用覆盖率驱动的多层次、多平台的功能验证方法,已经在FPGA原型系统下成功启动Linux OS,CoreMark分数为5.12 MHz,在14 nm工艺下主频可达到2 GHz.
    • 王旭; 李丽斯; 赵烁; 何虎
    • 摘要: 针对嵌入式设备对高性能处理器低功耗的需求,基于RISC-V指令集的标准,提出了一种顺序双发射的超标量处理器设计方法.处理器代号为Egret,采用九级流水线架构,支持RV32IMAFC指令集.经过UVM验证,Egret处理器Dhrystone性能可以达到1.76DMIPS/MHz,Coremark性能达到2.88Coremark/MHz,Whetstone性能达到0.86MWIPS/MHz.处理器在FPGA上能够稳定运行在100MHz.在SMIC 40nm LL工艺下,处理器频率为600MHz,面积为1mm2.
    • 孙彩霞; 李文哲; 高军; 王永文
    • 摘要: 为了追求更高的性能,处理器核的主频不断提升,处理器核的设计日益复杂,随之而来的是功耗问题越来越突出.除了在工艺级和电路级采用低功耗技术外,在逻辑设计阶段通过分析处理器核各个功能模块的特点并采用相应的技术手段,也可以有效降低功耗.对一款乱序超标量处理器核中功耗比较突出的模块——寄存器文件和再定序缓冲——进行了逻辑设计优化,在程序运行性能几乎不受影响的情况下明显减少了面积,降低了功耗.
    • 王旭; 付家为; 何虎
    • 摘要: 针对嵌入式设备对高性能数字信号处理器低功耗的需求,结合超标量处理器与超长指令字处理器各自的优点,提出一种将两种架构进行融合的单核处理器设计方法,取代ARM+DSP异构架构.充分发挥两者优势,降低处理器的功耗和面积,提高处理器在数字信号处理方面的性能;支持ARM指令集,顺序超标量模式的双发射和超长指令字模式的六发射能够极大提高地指令并行度.利用DSPStone基准测试程序对处理器进行测试验证,测试结果表明,混合架构的处理器性能平均提升了19.4%,最高提升了38.2%.%In view of embedded devices demands for digital signal processor with high performance and low power consumption,a hybrid microarchitecture integrating both Superscalar and very long instruction word (VLIW)in a single core was proposed to re-place ARM and DSP heterogeneous architecture. The hybrid microarchitecture with combinations of the advantages of Supersca-lar and VLIW reduced the power consumption and the area of the processor and improved the performance of the processor in digital signal processing.ARM instruction set was supported,and double launch under in-order Superscalar mode and six launch under VLIW mode greatly improved instruction parallelism.Results of tests and verification based on DSPStone benchmark show that hybrid microarchitecture can significantly improve the performance of the processor.The average improvement is 19.4%, and the maximum is 38.2%.
    • 付家为; 王旭; 何虎
    • 摘要: 描述在一款支持超标量与超长指令字结构的混合架构数字信号处理器上设计的分支预测结构.为控制硬件复杂度并充分提高预测准确度,设计双峰预测器与PAp预测器混合型预测结构,充分发挥两种预测器的优点.在设计完成的处理器上,运行标准DSPstone程序.实验结果表明,添加分支预测结构使得处理器性能平均提升23%,并且混合型预测结构相比单一预测结构在准确度方面优势明显.%A design of hybrid branch predictor on a digital signal processor which supports Superscalar-VLIW hybrid architecture is described.To control hardware complexity and improve the accuracy of prediction,a hybrid branch predictor of bimodal and PAp is selected for the branch prediction scheme.The standard DSPstone programs have been run on the processor.The experimental results show that the processor with hybrid branch predictor has an improvement of 23% on average compared with processor without branch predictor,and processor with hybrid branch predictor predicts more accurately than processor with only bimodal predictor.
    • 李源; 马海林; 何虎
    • 摘要: In order to reduce the area and power consumption of processor,this paper proposed a hybrid architecture of super-scalar/VLIW based on MIPS instruction set.Requirements of DSP to mobile and embedded devices were becoming higher and higher,data controling and data processing were realized by the CPU and DSP heterogeneous structure which was widespread used.The hybrid architecture processor had the functionality of general-purpose processor,which could improve DSP perform-ance with VLIW.This paper described and verified the design by LISA and PD,tested the generality performance through dhry-stone and coremark,the DSP performance through EEMBC-telecom.The test results demonstrate that the hybrid architecture processor can run the general program of MIPS instruction set,and it has high performance of digital signal processing in the VLIW mode.The design has good applicability in the high performance and low power consumption application.%针对嵌入式和移动设备对处理器高性能低功耗日趋强烈的要求,提出一种基于 MIPS 指令集的顺序超标量和超长指令字混合架构处理器设计方案,便于以同构多核架构代替目前业界普遍采用的 CPU 与 DSP 异构结构,降低功耗面积,同时以 VLIW 模式获得较好的 DSP 性能。在 PD(processor designer)平台下以 LISA 语言建立处理器的周期精度软件模拟器,通用性能和 DSP 性能分别由 dhrystone、coremark 基准测试程序及 EEMBC 的telecom 测试程序进行验证。测试结果表明,该设计以较低的硬件开销通过混合架构获得较高的数字信号处理性能,在高性能低功耗的处理器应用场景中拥有良好的适用性。
    • 罗杰
    • 摘要: 本文以甘肃省多条高等级公路高架桥梁为背景模型,经过噪声衰减计算,对比噪声预测数据超标情况,分析高架桥梁与噪声敏感目标高差、水平距离和噪声衰减的关系,分类提出噪声减缓措施设置原则,为以后的高架桥梁噪声减缓措施设计提供了依据.
    • 段凌霄; 孟建熠; 李晓明
    • 摘要: 针对超标量处理器中指令长时间占用重排序缓存引起指令退休缓慢的问题,提出了一种基于投机执行的两级退休机制.该方案根据指令有无异常和预测错误风险将指令分为有风险指令和无风险指令,对重排序缓存进行轻量化改进,只有存在异常和预测风险的指令才允许进重排序缓存,在确认风险消除后将指令快速退休.重命名寄存器从重排序缓存分离,负责寄存器重命名和结果乱序回写.实验结果表明,在硬件资源相同的情况下,基于该方案的处理器比传统的按序退休处理器的性能平均提高28.8%以上.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号