超标量
超标量的相关文献在1993年到2022年内共计115篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、贸易经济
等领域,其中期刊论文76篇、会议论文5篇、专利文献1411篇;相关期刊48种,包括计算机工程与科学、计算机工程与应用、计算机学报等;
相关会议5种,包括2009年全国高性能计算学术年会、第九届计算机工程与工艺全国学术年会、第十三届全国信息存储技术学术会议等;超标量的相关文献由191位作者贡献,包括何虎、尹飞、王旭等。
超标量
-研究学者
- 何虎
- 尹飞
- 王旭
- 付家为
- 周兴铭
- 多纳尔德·E·沃尔德克
- 大卫·S·莱文坦
- 奥伯雷·D·奥格登
- 杜勇
- 詹姆斯·A·卡勒
- 郭星辰
- 阿里·A·布尔萨巴尼
- 鲍尔·涂光国
- 李文哲
- 肖刚
- 胡向东
- 路冬冬
- 郑飞
- 高军
- A·瑟纳
- D·A·路易克
- E·伊斯梅尔
- G·M·斯尔伯曼
- K·J·基弗
- K·埃乔格卢
- N·S·哈诺卡
- P·B·温特菲尔
- S·兰加拉杰
- 丁丹
- 丁哲
- 侯毓敏
- 冯云
- 凌明
- 刘晓燕
- 周琼芳
- 唐纳德·E·沃尔德克尔
- 奥利弗·克伦·班恩
- 奥布里·D·奥格登
- 姚庆栋
- 孙彩霞
- 孙龙鹏
- 季柯丞
- 张凌峰
- 张明
- 张浩
- 时龙兴
- 曹文辉
- 李宽
- 李笑天
- 法瑞登·卡瑞
-
-
刘有耀;
潘宇晨
-
-
摘要:
为解决嵌入式领域对处理器不同性能面积的需求,以及对重排序缓冲区阻塞,保留站派遣长短周期指令时导致的吞吐率不平衡及堵塞问题,设计并优化了一种简便配置的参数化流水线超标量处理器。通过定制化流水线中的分支预测,缓存与运算单元,将RISC-V指令划分5大类处理,对不同周期的执行单元采用级联与并行的混合分布方式,将充当排序缓存中的指令再派遣,达到指令暂存和分类执行的目的,使一条不定周期指令可以携带多条单周期指令提交。缓存之间以直连方式进行通信,以避免复杂的公共数据总线以降低时序损耗。实验结果表明,该处理器可以通过配置达到IPC为0.746~1.476之间的性能,平均比同类型处理器IPC提升132.4%。
-
-
-
-
摘要:
Imagination Technologies和晶心科技(Andes Technology)联合宣布:双方合作借助与RISC V兼容的Andes AX45处理器内核,成功测试和验证了IMG B系列图形处理器(GPU)。Andes AX45是一款64位高性能和可配置的超标量中央处理器(CPU)。此次验证合作为AR/VR、车载信息娱乐系统(IVI)、工业和物联网(IoT)产品领域的客户提供了一种经过验证的、完整的解决方案,并为后续的持续测试奠定了基础。
-
-
孙彩霞;
郑重;
邓全;
隋兵才;
王永文;
倪晓强
-
-
摘要:
DMR是由国防科技大学计算机学院自研的一款兼容RISC-V架构的乱序超标量通用处理器核,支持用户态(user-mode)、特权态(supervisor-mode)和机器态(machine-mode)三种特权级模式,兼容RV64G指令集规范,并进行了 自定义向量扩展,虚存系统支持Sv39和Sv48,物理地址为44 b.DMR的单周期整数流水线为12级,指令乱序发射、顺序提交,指令发射宽度为4,实现了多个分布式调度队列,每拍最多可乱序调度9条指令执行.DMR采用覆盖率驱动的多层次、多平台的功能验证方法,已经在FPGA原型系统下成功启动Linux OS,CoreMark分数为5.12 MHz,在14 nm工艺下主频可达到2 GHz.
-
-
王旭;
李丽斯;
赵烁;
何虎
-
-
摘要:
针对嵌入式设备对高性能处理器低功耗的需求,基于RISC-V指令集的标准,提出了一种顺序双发射的超标量处理器设计方法.处理器代号为Egret,采用九级流水线架构,支持RV32IMAFC指令集.经过UVM验证,Egret处理器Dhrystone性能可以达到1.76DMIPS/MHz,Coremark性能达到2.88Coremark/MHz,Whetstone性能达到0.86MWIPS/MHz.处理器在FPGA上能够稳定运行在100MHz.在SMIC 40nm LL工艺下,处理器频率为600MHz,面积为1mm2.
-
-
孙彩霞;
李文哲;
高军;
王永文
-
-
摘要:
为了追求更高的性能,处理器核的主频不断提升,处理器核的设计日益复杂,随之而来的是功耗问题越来越突出.除了在工艺级和电路级采用低功耗技术外,在逻辑设计阶段通过分析处理器核各个功能模块的特点并采用相应的技术手段,也可以有效降低功耗.对一款乱序超标量处理器核中功耗比较突出的模块——寄存器文件和再定序缓冲——进行了逻辑设计优化,在程序运行性能几乎不受影响的情况下明显减少了面积,降低了功耗.
-
-
王旭;
付家为;
何虎
-
-
摘要:
针对嵌入式设备对高性能数字信号处理器低功耗的需求,结合超标量处理器与超长指令字处理器各自的优点,提出一种将两种架构进行融合的单核处理器设计方法,取代ARM+DSP异构架构.充分发挥两者优势,降低处理器的功耗和面积,提高处理器在数字信号处理方面的性能;支持ARM指令集,顺序超标量模式的双发射和超长指令字模式的六发射能够极大提高地指令并行度.利用DSPStone基准测试程序对处理器进行测试验证,测试结果表明,混合架构的处理器性能平均提升了19.4%,最高提升了38.2%.%In view of embedded devices demands for digital signal processor with high performance and low power consumption,a hybrid microarchitecture integrating both Superscalar and very long instruction word (VLIW)in a single core was proposed to re-place ARM and DSP heterogeneous architecture. The hybrid microarchitecture with combinations of the advantages of Supersca-lar and VLIW reduced the power consumption and the area of the processor and improved the performance of the processor in digital signal processing.ARM instruction set was supported,and double launch under in-order Superscalar mode and six launch under VLIW mode greatly improved instruction parallelism.Results of tests and verification based on DSPStone benchmark show that hybrid microarchitecture can significantly improve the performance of the processor.The average improvement is 19.4%, and the maximum is 38.2%.
-
-
付家为;
王旭;
何虎
-
-
摘要:
描述在一款支持超标量与超长指令字结构的混合架构数字信号处理器上设计的分支预测结构.为控制硬件复杂度并充分提高预测准确度,设计双峰预测器与PAp预测器混合型预测结构,充分发挥两种预测器的优点.在设计完成的处理器上,运行标准DSPstone程序.实验结果表明,添加分支预测结构使得处理器性能平均提升23%,并且混合型预测结构相比单一预测结构在准确度方面优势明显.%A design of hybrid branch predictor on a digital signal processor which supports Superscalar-VLIW hybrid architecture is described.To control hardware complexity and improve the accuracy of prediction,a hybrid branch predictor of bimodal and PAp is selected for the branch prediction scheme.The standard DSPstone programs have been run on the processor.The experimental results show that the processor with hybrid branch predictor has an improvement of 23% on average compared with processor without branch predictor,and processor with hybrid branch predictor predicts more accurately than processor with only bimodal predictor.
-
-
李源;
马海林;
何虎
-
-
摘要:
In order to reduce the area and power consumption of processor,this paper proposed a hybrid architecture of super-scalar/VLIW based on MIPS instruction set.Requirements of DSP to mobile and embedded devices were becoming higher and higher,data controling and data processing were realized by the CPU and DSP heterogeneous structure which was widespread used.The hybrid architecture processor had the functionality of general-purpose processor,which could improve DSP perform-ance with VLIW.This paper described and verified the design by LISA and PD,tested the generality performance through dhry-stone and coremark,the DSP performance through EEMBC-telecom.The test results demonstrate that the hybrid architecture processor can run the general program of MIPS instruction set,and it has high performance of digital signal processing in the VLIW mode.The design has good applicability in the high performance and low power consumption application.%针对嵌入式和移动设备对处理器高性能低功耗日趋强烈的要求,提出一种基于 MIPS 指令集的顺序超标量和超长指令字混合架构处理器设计方案,便于以同构多核架构代替目前业界普遍采用的 CPU 与 DSP 异构结构,降低功耗面积,同时以 VLIW 模式获得较好的 DSP 性能。在 PD(processor designer)平台下以 LISA 语言建立处理器的周期精度软件模拟器,通用性能和 DSP 性能分别由 dhrystone、coremark 基准测试程序及 EEMBC 的telecom 测试程序进行验证。测试结果表明,该设计以较低的硬件开销通过混合架构获得较高的数字信号处理性能,在高性能低功耗的处理器应用场景中拥有良好的适用性。
-
-
罗杰
-
-
摘要:
本文以甘肃省多条高等级公路高架桥梁为背景模型,经过噪声衰减计算,对比噪声预测数据超标情况,分析高架桥梁与噪声敏感目标高差、水平距离和噪声衰减的关系,分类提出噪声减缓措施设置原则,为以后的高架桥梁噪声减缓措施设计提供了依据.
-
-
段凌霄;
孟建熠;
李晓明
-
-
摘要:
针对超标量处理器中指令长时间占用重排序缓存引起指令退休缓慢的问题,提出了一种基于投机执行的两级退休机制.该方案根据指令有无异常和预测错误风险将指令分为有风险指令和无风险指令,对重排序缓存进行轻量化改进,只有存在异常和预测风险的指令才允许进重排序缓存,在确认风险消除后将指令快速退休.重命名寄存器从重排序缓存分离,负责寄存器重命名和结果乱序回写.实验结果表明,在硬件资源相同的情况下,基于该方案的处理器比传统的按序退休处理器的性能平均提高28.8%以上.
-
-
-
谢菲;
张浩
- 《2009年全国高性能计算学术年会》
| 2009年
-
摘要:
x86是目前应用最广泛的复杂指令(CISC)系统,对大量非典型特性进行支持,从而花费大量硬件资源。而非典型特性的支持往往会影响典型功能的效率,不利于硬件资源的优化配置,限制处理系统性能的提升。本文首先分析了x86指令集及x86程序的固有特性,进而提出了一种基于RISC超标量处理系统核心的软硬件协同设计的实现方案。新处理系统的面积仅为采用硬件译码设计的x86处理系统的78.3%,性能达到采用硬件译码设计的X86处理系统的90.6%以上,并有较大的提升空间。
-
-
许邦建
- 《第九届计算机工程与工艺全国学术年会》
| 2005年
-
摘要:
在现代超标量微处理器中,指令指针自加电路中需要多级加法电路.但指令指针自加电路的时间要求越短越好,这就给指令指针自加电路的设计带来了很大的挑战.本文对此问题提出了一种基于译码加法器的指令指针自加电路.分析表明:此电路具有很好的性能,可以满足指令指针自加电路的时间要求.
-
-
邓让钰;
谢伦国;
邢座程
- 《第十三届全国信息存储技术学术会议》
| 2004年
-
摘要:
EPIC设计思想将结构信息充分暴露给编译器,编译器静态开发指令级并行性,与超标量结构相比,极大简化了硬件设计的复杂性.论文深入分析了EPIC方法的基础,通过分析总结了EPIC体系结构对存储系统设计带来的挑战,最后提出存储系统设计的出路在于开发存储级并行性.
-
-
李方慧;
龙腾
- 《中国电子学会第七届学术年会》
| 2001年
-
摘要:
数字信号处理器是数字化时代的主流器件.数字信号处理算法的需求和进展一直掌握着DSP处理器结构的发展和演变过程.本文对当前的数字信号处理器技术进行了全面的分析和总结,从结构上进行了分类,对比了各种结构的技术特性,各自的优缺点,以及它们的性能.
-
-
李方慧;
龙腾
- 《中国电子学会第七届学术年会》
| 2001年
-
摘要:
数字信号处理器是数字化时代的主流器件.数字信号处理算法的需求和进展一直掌握着DSP处理器结构的发展和演变过程.本文对当前的数字信号处理器技术进行了全面的分析和总结,从结构上进行了分类,对比了各种结构的技术特性,各自的优缺点,以及它们的性能.
-
-
李方慧;
龙腾
- 《中国电子学会第七届学术年会》
| 2001年
-
摘要:
数字信号处理器是数字化时代的主流器件.数字信号处理算法的需求和进展一直掌握着DSP处理器结构的发展和演变过程.本文对当前的数字信号处理器技术进行了全面的分析和总结,从结构上进行了分类,对比了各种结构的技术特性,各自的优缺点,以及它们的性能.
-
-
-
-
-
-
-
-
-
-
-
- 广东赛昉科技有限公司
- 公开公告日期:2021-10-01
-
摘要:
本发明涉及处理器技术领域,具体涉及一种解决RISC‑V在超标量乱序处理器被重复使用的方法及系统,本发明于DECODE模块中增加寄存器来记录VSTART是否被vector指令利用过;通过寄存器记录组间和组内vector指令情况,并在当前block中存在vector指令时,将寄存器置成1;对每一条vector指令使用完VSTART后,在这条vector指令commit的时候进行VSTART清0;当判断存在branch类型的指令时,则对寄存器的状态进行保存,若分支预测错误则对处理器和寄存器的状态进行恢复。本发明在超标量乱序处理器中在不刷新流水线,保证指令正常执行的情况下,使得所有的vector指令可以拿到正确的VSTART的值,不会因为乱序执行,使得前后vector指令的VSTART值发生错误.既保证了程序的正确性又提高了指令并行度和执行效率。