共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
串匹配是一个非常经典的问题,本文通过回顾和分析GPU的串匹配算法的国内外研究近况,提出了GPU的串匹配算法的一些新的研究方向,特别是将一些编译解释性的工作放在GPU上实现的思想。 相似文献
4.
《佳木斯教育学院学报》2019,(7)
本文介绍了GPU并行计算,说明了GPU并行计算在水动力学模型及分布式水文模型上均已有很好的应用。本文就GPU在水文模型中、在智慧水务大数据中、在水库调度中及在中长期水文预报中的应用前景进行了研究。 相似文献
5.
7.
越来越多的研究人员和商业组织开始利用GPU来完成大规模的计算,并开创了一个新的研究领域:基于GPU的通用并行计算。 相似文献
8.
结合最新的并行计算技术,基于VS2012搭建了Open MP、MPI、C++AMP、CUDA 6.0等四个并行实验平台,并对不同实验平台实现PI值计算。实验结果说明这种并行计算环境具有良好的性能与可扩展性;Open MP与MPI等CPU计算加速效果与CPU内核数目成比例,C++AMP与CUDA 6.0等GPU计算加速效果与GPU物理计算核心数目成正比;同等条件下GPU物理计算核心数目远多于CPU核心数目,用GPU进行计算往往可获得更高的性价比。 相似文献
9.
如何提高字符串实际匹配效率一直是信息匹配领域中非常重要的研究课题。在分析字符串匹配并行规律的基础上,结合GPU并行体系结构,对Sunday算法实现并行化。在CPU和GPU不同计算平台上分别做了对比实验,实验结果显示基于GPU并行实现的Sunday算法比传统Sunday算法具有更高的匹配速度。 相似文献
10.
11.
12.
由于GPU(Graphic Processing Unit)在图像处理方面的良好性能,国内外已经有很多专家学者在应用GPU进行图像的并行处理.基于CUDA(Compute Unified Device Architecture)这种并行计算平台,利用GPU的强大计算功能对Hough变换中最耗时的部分进行计算.实验表明,这种方法对Hough变换的并行化有很好的加速效果. 相似文献
13.
《实验室研究与探索》2017,(7):118-121
针对舰载警戒雷达实验室建设雷达模拟仿真过程中模拟数据计算量大、模拟数据类型多、更新速度快及雷达回波显示难的问题,在分析雷达模拟数据处理特点的基础上,介绍了CPU/GPU协同运算技术的基本情况,提出了CPU/GPU协同运算技术在雷达模拟数据生成与回波显示方面的具体应用方法,明确了CPU/GPU协同运算基本流程与各自任务分工,建立了CPU雷达模拟仿真数据组织与生成模型,给出了GPU雷达回波渲染与显示方法,并采用向量元素的遍历查找算法完成雷达回波数据获取和雷达回波纹理数据更新。通过在通用计算机对传统CPU运算和CPU/GPU协同运算两种方法进行仿真,仿真结果证明了这一技术应用的可行性与先进性,这种技术的应用对于提高舰载警戒雷达模拟仿真效率与逼真度有着重要意义。 相似文献
14.
高性能计算是计算科学的一个分支,研究并行算法和开发相关软件,并致力于开发高性能计算机。目前较为流行的并行程序设计模型为基于消息传递M P I(Message Passing interface)的编程模式,基于共享内存的O p e n M P模式和结合MPI+OpenMP的混合编程模型,以及利用GPU作为并行数据计算设备(GPU计算的模式就是在异构协同处理计算模型中,将CPU与GPU结合起来加以利用,应用程序的串行部分在CPU上运行,而计算任务繁重的部分则由GPU来加速)的MPI+OpenMP+CUDA的三级混合编程模型。本文基于中国科学院近代物理研究所超算中心的深腾7000G集群,进行GPU通用计算能力和并行编程模型的研究,采用MPI+CUDA多粒度混合编程模型,节点间使用MPI进行通信, 相似文献
15.
为提高三维场景实时阴影渲染性能,通过图形硬件编程方法,采用HLSL实现Shadow Map。实验表明,GPU的渲染速度远远大于CPU,在计算负载由传统的CPU转移到GPU处理之后,算法的运行效率得到明显提升。 相似文献
16.
分析了光线跟踪渲染算法在GPU上实现的流程;设计了CUDA平台上基于BVH加速结构的光线跟踪渲染引擎,针对CUDA架构的特点重新设计了BVH遍历算法和间接反射计算算法;并在四个场景和两种分辨率下针对GPU和CPU实现进行了详细对比测试。通过分析实验结果,基于GPU加速的光线跟踪算法在不同复杂度的场景下相比其CPU实现都有较高的性能提升。 相似文献
17.
18.
我们介绍了用8系列的NVIDIAGPU来做密集线性代数的性能。我们的GEMM(通用矩阵乘法)程序比提供商的实现速度提升了60%,并且达到了硬件性能的峰值。我们的LU,QR和丘列斯基(矩阵)分解都达到了GEMM峰速的80—90%。我们在两个GPU上并行的LU达到了约300Gflop/s。这些结果是通过挑战对GPU的现有观点和编程指导思想而实现的。我们认为新型GPU应该被看成多线程多核的向量单元。 相似文献
19.
《实验室研究与探索》2017,(1)
在大数据时代,兼顾大数据处理与高性能计算是目前对计算机系统的迫切需求。针对Spark大数据处理与基于GPU的高性能计算,分析了基于GPU的Spark技术。它主要通过构建CPU和GPU的异构并行,使计算机获得强大的计算能力,并在实验室环境下探讨了Spark-GPU技术的实现,阐述了算法实现的技术流程。在此基础上,通过仿真实验评估了Spark和Spark-GPU技术的性能。实验表明,Spark-GPU技术可以达到上百倍的加速比,这对图像处理以及信息检索等领域的发展都具有重要推动作用。 相似文献