首页> 外文期刊>電子情報通信学会技術研究報告 >FaSTARのFPGA実装におけるOut-Of-Order機構の評価
【24h】

FaSTARのFPGA実装におけるOut-Of-Order機構の評価

机译:FaSTAR的FPGA实现中的乱序机制评估

获取原文
获取原文并翻译 | 示例
           

摘要

CFD(Computational Fluid Dynamics)は航空機部品の設計において重要なツールとなっている.CFDパッケージの1つであるFaSTARは組み合わせて使うことのできる各種のソルバを提供しており,また格子データを自動に生成できる.しかし,FaSTARはその不規則なデータ構造からクラスタ上のソフトウェアの実行では十分な性能が得られない.例えば倍精度浮動小数点での複合代入演算子が用いられる計算では同一のデータにアクセスが複数回かつ連続で行われるため,パイプラインストールが発生しやすい.我々はリコンフィギャラブルシステムであるFPGAで構成されたFLOPS-2Dを用いてメモリアクセスの問題を改善し,FaSTARの高速化を目指す.前の研究では例に挙げた問題を解決するOut-Of-Order機構を提案し,実装した.本研究では,それの適用範囲を広げ,この機構の性能を検証した.その結果,対象となった計算全体で2.66GHzのIntel Core2Duoによるソフトウェア実行の3.21倍の高速化を達成した.%Computational Fluid Dynamics is an important tool to design aircraft components. FaSTAR is one of the most recent CFD program package with various solvers and automatic generation of grid data. However, FaSTAR is inefficient to be executed in parallel machines because of its irregular data structure. For example, calculation using compound assignment operators suffers enormous pipeline hazards caused by consectively accessing same data. Using FLOPS-2D, one of reconfigurable system constructed of FPGAs, we would like to improve the problems caused by memory access, and accelerate execution of FaSTAR. In the first step of whe work, an Out-Of-Order system was proposed. In this work, we applied this system to various algorithms, and evaluated its performance. Consequently, with FPGAs, the selected algorithms runned 3.21 times as fast as software execution on Intel Core2Duo(2.66GHz).
机译:CFD(计算流体动力学)已成为飞机零件设计中的重要工具。作为CFD软件包之一的FaSTAR提供了多种求解器,这些求解器可以组合使用并可以自动生成网格数据。但是,由于其不规则的数据结构,FaSTAR无法通过在群集上执行软件来获得足够的性能。例如,在使用带有双精度浮点的复合赋值运算符的计算中,多次连续访问同一数据,因此很可能发生管道停顿。我们的目标是通过使用由FPGA构成的FLOPS-2D(一种可重配置系统)来改善内存访问问题,从而提高FaSTAR的速度。在先前的研究中,我们提出并实现了一种无序机制来解决示例中给出的问题。在这项研究中,扩大了其应用范围,并验证了该机制的性能。结果,在整个计算过程中,我们的速度比2.66 GHz的Intel Core2Duo的软件执行速度快3.21倍。计算流体动力学是设计飞机部件的重要工具,FaSTAR是最新的CFD程序包之一,具有各种求解器和自动生成网格数据的功能,但是由于其不规则的数据结构,FaSTAR在并行机中执行效率低下例如,使用复合赋值运算符进行计算会因连续访问相同数据而遭受巨大的流水线危害。使用FLOPS-2D(一种由FPGA构造的可重配置系统),我们希望改善由内存访问引起的问题,并加快FaSTAR的执行在工作的第一步中,提出了无序系统,在这项工作中,我们将该系统应用于各种算法并评估了其性能。使用FPGA时,所选算法的运行速度是运行速度的3.21倍在Intel Core2Duo(2.66GHz)上执行软件。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号