异构平台
异构平台的相关文献在1998年到2022年内共计316篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、工业经济
等领域,其中期刊论文123篇、会议论文15篇、专利文献232835篇;相关期刊89种,包括信息系统工程、信息工程大学学报、广播与电视技术等;
相关会议15种,包括第32届中国数据库学术会议、全国抗恶劣环境计算机第二十四届学术年会、2014全国高性能计算学术年会等;异构平台的相关文献由792位作者贡献,包括沈莉、王飞、刘蓬侠等。
异构平台—发文量
专利文献>
论文:232835篇
占比:99.94%
总计:232973篇
异构平台
-研究学者
- 沈莉
- 王飞
- 刘蓬侠
- 吴伟
- 宋卓
- 李根
- 武文浩
- 马金全
- 刘健男
- 周文浩
- 岳春生
- 余时强
- 喻西香
- 张为华
- 张清
- 徐磊
- 徐莹
- 朱光喜
- 朱琪
- 李小明
- 杨铀
- 管茂林
- 胡浩
- 郭成安
- 钱宏
- 万双爱
- 乔鑫
- 刘毅
- 卓子寒
- 吕欣润
- 吴敏
- 张奕欣
- 张程鹏
- 张翀
- 彭华
- 景永年
- 朱小谦
- 朱敏
- 杜虹
- 杨超
- 王友升
- 王同雷
- 王春娥
- 秦杰
- 肖谦
- 谷杰铭
- 邢潇
- 邹丹
- 钱宏文
- A-R·阿德-塔巴塔巴伊
-
-
马海龙;
尹梓诺;
胡涛
-
-
摘要:
针对现有异常检测方法因为预学习以及噪声敏感所导致的检测时间长和误报率高的问题,该文通过对现有异常检测案例进行分析,从平台异构性角度提出了一种异常检测的新方法:将程序分别运行在多个异构平台,正常程序的所有平台运行结果相同,而异常程序在不同平台显示出差异性。基于此,该文设计了一种面向异构化平台的轻量级程序异常检测方法,收集系统状态数据并利用特征工程构建对异常表征明显的多维矢量,采用标签编码和Max-Min归一化对数据预处理,计算数据间差异度并应用阈值规则比较分析判别异常。相比于无监督特征聚类方法,所提方法的检测准确率提升了13.12%且具有低误报率和较短的检测时间。
-
-
招商银行隐私计算互联互通项目组
-
-
摘要:
数字化时代,数据成为重要的生产要素,也是银行数字化经营和风险控制的关键。但在现实生活中,数据产生于不同的场景,金融机构往往需要从众多机构实体中获取海量数据以支撑业务体系。
-
-
吕志强;
刘凯
-
-
摘要:
在非合作通信接收中,海事卫星接收系统存在大范围多普勒频偏和信号数据量大带来的识别速度慢的问题。利用GPU平台做并行加速信号识别,具有高效的性能,针对接收信号载波偏移的问题,在CPU端使用基于自相关的定时误差估计完成突发信号的定时同步后,通过信号的互相关函数提取载频估计偏差,对载波粗估计补偿;利用信号帧中独特码字和导频码,采用数据辅助的方式进行频偏精确估计,实现了BGAN信号的载波恢复,可以实现对16QAM、32QAM、64QAM的载频的精确估计,在低信噪比情况下仍能保持良好的估计性能。实验结果表明GPU+CPU异构平台的使用大大地提高了运算效率。
-
-
施国强;
刘泽伟;
林廷宇;
徐钊;
杨星熠;
郭丽琴;
贾政轩
-
-
摘要:
针对复杂产品建模与仿真系统侧重于解决异构模型联合仿真,无法实现仿真资源的按需共享、协同的问题,提出了一种面向复杂产品建模仿真系统的开放式云架构,实现跨组织仿真软件、硬件资源的按需共享、协同,从而支持复杂产品全系统、全生命周期随时随地、实时、连贯、透明地请求、访问和获得仿真服务。并使用对象过程方法论对系统的仿真互操作及仿真资源的按需共享、协同过程进行建模和推演。通过控制系统的研制应用范例,验证了面向复杂产品建模与仿真系统的开放式云架构设计的有效性。
-
-
李放;
曹健;
李普;
谢豪;
赵雄波;
王源;
张兴
-
-
摘要:
为解决基于深度学习目标检测模型规模大、在边缘设备上难以部署的问题,以YOLO目标检测模型为例,设计实现基于ARM+FPGA异构平台的目标检测加速模块。该系统使用剪枝、量化后的压缩模型,在FPGA实现神经网络前向推理加速,在ARM中实现加速器调度。实验结果表明,部署至Xilinx ZCU102开发板上,该模块在200 MHz工作频率下,平均计算性能达到425.8 GOP/s,推理压缩模型速度达到30.3 fps,模块功耗为3.56 W,证明该加速模块具备可配置性。
-
-
徐会希;
姜成林
-
-
摘要:
对基于无人水面艇(USV)和多自主水下机器人(AUVs)组成的异构协同海洋探测系统进行综述.首先介绍不同的USV与多AUVs组成的异构海洋探测系统的最新进展和应用成果,从系统设计概念和技术特点对这些异构系统进行分析和比较;其次对多水下机器人异构系统研究中的协同关键技术进行综述,重点分析协同问题中异构协同、系统任务分配、路径规划和编队控制等问题;而后从环境和硬件的外界约束以及海洋探测系统辅助技术两个方面分析海洋探测系统所面临的技术难点与问题;最后通过分析当前取得的进展和实际需求对多水下机器人异构海洋探测系统的发展前景进行展望.
-
-
杨迪;
马金全;
岳春生;
沈志翀;
沈小龙
-
-
摘要:
任务调度算法的研究一直是异构计算技术研究中的热点,充分挖掘异构处理平台的并行优势,可最大限度实现平台资源的高效利用.通过分析异构处理平台的执行特点,设计符合异构处理平台的任务调度策略,提出面向异构处理平台的最长路径列表调度算法(Longest path list scheduling algorithm,LPLS).算法在任务优先级阶段,基于最长路径列表计算优先级,最耗时路径上的任务被优先调度;在处理器选择阶段,遵循任务完成时间最小的原则,所选择的处理器可使下阶段任务的完成时间更短,异构平台整体处理时间更小.仿真实验结果表明,相比于经典的HEFT算法,LPLS算法是一种负载更加均衡的算法,具有调度长度更短、效率更高等优势.
-
-
吴翼虎;
钱宏文;
朱江伟
-
-
摘要:
随着软件无线电、软件化卫星等技术的发展,中间件作为软件平台支撑技术得到广泛的研究.当前中间件主要包含面向对象的组件型和消息中间件,但是大部分中间件,如Kafka、RocketMQ等均面向个人计算机平台应用,无法适配到嵌入式平台上.同时其设计过多关注高并发和高性能,无法满足军用电子系统实时性、高可靠等方面的要求.为了满足此类应用,对象管理组织提出了以数据为中心的发布/订阅通信模式为其提供数据分发服务,并发布了相关规范.通过将轻量化的极端资源受限环境数据分发服务(Extreme Resource Constrained Environment Data Distribution Service,XRCE-DDS)中间件部署到CPU、FPGA和DSP等嵌入式处理器上,实现了在嵌入式异构平台中基于数据分发服务中间件的不同主题数据的发布/订阅.
-
-
钱成铎;
方振国;
汪珺;
严寒
-
-
摘要:
针对图像及视频信息的高速采集处理问题,提出一种基于FPGA的硬件数据加速方法,将采集的数据通过高速内存DDR3与FPGA硬件逻辑资源进行数据的异构传输交换,自主设计了ARM端与FPGA端的数据转换接口,实现数据信息采集与处理的无缝对接,有效地提升了转换速率,并降低了系统功耗,最后通过ZYNQ-7000设计了图像采集处理系统,验证了异构平台之间高速数据交换的有效性和准确性。
-
-
钱成铎;
方振国;
汪珺;
严寒
-
-
摘要:
针对图像及视频信息的高速采集处理问题,提出一种基于FPGA的硬件数据加速方法,将采集的数据通过高速内存DDR3与FPGA硬件逻辑资源进行数据的异构传输交换,自主设计了ARM端与FPGA端的数据转换接口,实现数据信息采集与处理的无缝对接,有效地提升了转换速率,并降低了系统功耗,最后通过ZYNQ-7000设计了图像采集处理系统,验证了异构平台之间高速数据交换的有效性和准确性.
-
-
ZHU Hai-feng;
朱海锋;
WU Min;
吴敏;
ZHU Hui-zhu;
朱会柱;
LI Yu;
李裕;
WEI Hua-bo;
魏华波
- 《第十五届中国航空测控技术年会》
| 2018年
-
摘要:
对软件通信体系结构(Software Communication Architecture,SCA)中异构处理器开发平台性能特点进行了分析,针对目前多核异构处理系统的发展,提出了一种基于Davinci+ZYNQ7000+ARM的异构平台设计框架.针对软件无线电系统中对于DSP和FPGA中没有通过软总线进行屏蔽底层交互通信的弱点,影响了系统开发过程中屏蔽硬件模块的缺陷,采用目前主流的ARM+X架构.通过对ARM系统硬件架构分析,提出了基于CORBA软总线的异构平台的软总线设计方法.用户只需关注逻辑层之上的通信策略,而不需要关注底层硬件数据交互的实现细节即可进行系统设计,从而实现通信过程的透明传输.该设计架构这大大减小了系统开发难度和成本,缩短了系统开发时间,对未来的复杂航电系统设计起到了很好的推动作用.
-
-
TANG Ge-Xuan;
唐舸轩;
ZHOU Yi-Hua;
周艺华;
ZHANG Chang-You;
张常有;
Ji Chen-Hui;
籍晨晖;
Dang Yun-Long
- 《2016年全国高性能计算学术年会》
| 2016年
-
摘要:
深度置信网络(DBN)模型常伴随高维度、大数据量等计算,使得其训练过程相对缓慢.为提高深度置信网络的模型训练效率,提出了一种基于异构平台的混合并行优化方法.主要包括:(1)模型训练分解为细粒度子任务,设计单个子任务的并行优化方法.(2)针对多核CPU和众核GPU设备,设计细粒度子任务的调度方案,使两种计算资源负载均衡.(3)数据并行与任务并行策略相结合,实现一种异构混合并行算法.在Intel(R)Xeom(R)CPU(6核)和NVIDIA Tesla K20Xm GPU(2688核)实验平台上,针对MNIST手写体识别数据集,在保证识别准确率98.07%的前提下,混合并行算法与CPU串行程序相比,取得6.3x加速比,与CPU多核并行程序相比,取得2x加速比.
-
-
XU Jing-Heng;
徐敬蘅;
甘霖;
GAN Lin;
FU Hao-Huan;
付昊桓;
YANG Chao;
杨超;
XUE Wei;
薛巍;
XIONG Wei;
熊伟;
杨广文;
YANG Guang-Wen;
ZHENG Wei-Min;
郑纬民
- 《2014全国高性能计算学术年会》
| 2014年
-
摘要:
大气模式是描述大气中的各种物理量随时间及空间变化的科学计算程序.用大气模式对未来气候进行预估,是科学理解全球气候变化中最为重要的一环,长时间以来一直受到科学界的广泛关注.随着近年来气候对人类生产生活的影响日益加深,如何利用高性能计算领域的相关技术找到一种高效求解复杂大气模式方程的方法,成为亟待解决的关键问题.大气模式动力框架是影响大气模式计算可扩展性和计算效率的核心模块,欧拉方程是目前最常见的大气模式动力框架数学方程.本文中,基于CPU-GPU异构平台对欧拉方程求解器进行了实现和优化加速.与之前针对二维浅水波方程的工作相比,欧拉大气方程的求解算法更加复杂(浮点运算量增加了超过两倍).而且三维数据模型的引入,使得程序无论是在数据规模上,还是在通信密集度上都带来了更大的挑战.针对这些挑战:首先,本文设计了一种异构任务划分机制,使得在同一结点内的CPU处理器以及GPU加速器能同时进行工作,在显著提升计算效率的同时实现了高效的计算通信重叠.其次,运用一系列的并行优化方法分别针对GPU和CPU体系结构进行了全面系统的优化,显著提升了程序的整体性能.相较于12核CPU优化版本,基于CPU-GPU异构平台的最优版本在不同数据规模下取得了超过4.7倍的加速效果.与此同时,异构版本还具有良好的可扩展性,可以进一步用于高分辨率大气模拟.
-
-
Xiao Xuan-ji;
肖玄基;
Zhang Yun-quan;
张云泉;
Li Yu-cheng;
李玉成;
Yuan Liang;
袁良
- 《2012全国高性能计算学术年会》
| 2012年
-
摘要:
MAGMA是第一个面向下一代体系架构(多核CPU和GPU)开源的线性代数软件包,它采用了诸多针对异构平台的优化方法,包括了混合同步,通信避免和动态任务调度系统.它在功能,数据存储,接口上与LAPACK相似,可以发挥GPU的巨大计算能力进行数值计算.本文首先对MAGMA中的矩阵分解算法进行分析;然后通过测试结果,分析 MAGMA有效的优化和并行方法,为 MAGMA使用、优化提供有益的建议;最后本文提出了一种对于矩阵分块算法的自适应调优的方法,经过测试,对于SGEQRF函数加速比达到1.09.
-
-
李嘉;
梁瑾
- 《2012中国制导、导航与控制学术会议》
| 2012年
-
摘要:
针对三维异构平台的围捕问题,提出了一套实现集结模态的具体方法.通过数据融合确定逃跑者位置.并由此确定队形基准无人车,完成多无人车集结点设置.引入匹配函数,实现集结点分配.使用基于迂回环的子目标点生成策略,引导无人车以隐蔽方式进入集结点.室内试验表明,该算法可以快速完成围捕任务,系统适应性良好.
-
-
-
- 《第32届中国数据库学术会议》
| 2015年
-
摘要:
GPU以及集成式的多核CPU GPU架构凭借其拥有强大的并行处理能力和可编程流水线方式,已经成为数据库领域的研究热点.为充分发掘异构平台的潜力,提升列式数据库查询的性能,本文在充分考虑异构平台体系架构差异的基础上,首先提出了GPU多线程平台上进行连接的数据划分策略ICMD(Improved Coordinate Module Distribution),利用GPU流处理器并行处理各个子空间上的连接.然后利用任务评估分配模型实现查询负载的动态分配,使得查询操作在多核CPU、GPU以及其他加速器等部件之间并行执行.同时利用片上全局同步机制,局部内存重用技术优化并行连接算法.实验采用SSB基准测试集测试,结果显示Intel(R)HD Graphics 4600平台上并行连接查询相比于CPU版本获得了135倍的加速比.
-
-
胡国;
赵小冬;
韩伟;
白林亭;
李明娟
- 《全国抗恶劣环境计算机第二十四届学术年会》
| 2014年
-
摘要:
CFD(计算流体力学)计算任务具有计算密集,耗时集中等特点.在CPU+FPGA异构平台下,将FPGA作为硬件加速协处理器可以实现CFD计算性能的提升.本文针对Euler3D程序开展了计算任务的软硬件划分和模块的硬化与封装研究,并在搭建的CPU+FPGA平台下进行了硬件加速实验与验证.减少I/O开销和利用多片FPGA并行加速是进一步提升CFD计算硬件加速性能的有效手段.
-
-
Xuwei Xia;
夏徐伟;
Xiaoqian ZHU;
朱小谦;
Dan ZOU;
邹丹;
Min ZHU;
朱敏;
Shaoliang PENG;
彭绍亮
- 《2014全国高性能计算学术年会》
| 2014年
-
摘要:
MrBayes软件在生物信息学领域应用广泛.它使用Metropolis coupled Markov chain Monte Carlo(MC3)算法对一组能够反映生物物种遗传信息的DNA序列进行贝叶斯系统发育推断,最后得出表示生物之间进化关系的系统发育树.本文提出了“节点序”遍历方式流水线模型和多GPU并行任务划分模型.两个模型主要解决了MrBayes MC3存在的并行问题.使用“节点序”代替原有“链序”的遍历方式,改进算法的流水线模型,提高并发度,提升了单GPU并行执行性能,在百万次迭代时,性能提升8%到13%.多GPU并行任务划分模型利用父子节点数据之间的相关性以及节点内部数据之间的无关性,将GPU端的执行任务做进一步划分,解决了不同GPU间马尔科夫链计算的相关问题,缩短每条马尔科夫链的执行时间,性能提升了15%到21%.
-
-
Wei ZHAO;
赵慰;
Yonghua ZHAO;
赵永华;
Xiaohui LIU;
刘晓辉;
Lixin HE;
何力新
- 《2013全国高性能计算学术年会》
| 2013年
-
摘要:
第一性原理计算软件在密度泛函理论的发展中起着重要作用.相比平面波方法,局域轨道法更适合处理大规模多体问题.随着问题规模的不断增大和计算机计算能力的提升,软件的并行加速成为一个重要课题.在继续增加CPU处理器数量已经无法明显提升程序性能的情况下,MPI结合CUDA、MIC等众核架构实现的异构并行成为一个新的解决方案.在中国科学技术大学量子信息实验室第一性原理计算软件的基础上,使用MPI+OpenMP+CUDA三级并行对局域轨道法第一性原理计算进行加速,单GPU测试取得了约15倍的加速比,多GPU测试也取得了相应的加速比.测试结果同时验证了使用GPU计算可以保证计算精度.