共查询到20条相似文献,搜索用时 31 毫秒
1.
针对分子动力学串行计算速度不足问题,设计一种基于MPI+OpenMP的并行编程模型,实现LAMMPS并行计算。从而满足在节点间采用MPI进行消息传递并行,在节点内采用OpenMP共享内存模式多线程并行;最后根据分子动力学自身计算特点,对近邻表的构建以及力的计算进行优化,同时将并行结果和串行结果以及纯OpenMP运行时间和混合模型运行时间作对比。实验结果表明,采用MPI+OpenMP混合并行编程模型不仅能够加快计算速度,而且具有很好的扩展性。 相似文献
2.
高性能计算是计算科学的一个分支,研究并行算法和开发相关软件,并致力于开发高性能计算机。目前较为流行的并行程序设计模型为基于消息传递M P I(Message Passing interface)的编程模式,基于共享内存的O p e n M P模式和结合MPI+OpenMP的混合编程模型,以及利用GPU作为并行数据计算设备(GPU计算的模式就是在异构协同处理计算模型中,将CPU与GPU结合起来加以利用,应用程序的串行部分在CPU上运行,而计算任务繁重的部分则由GPU来加速)的MPI+OpenMP+CUDA的三级混合编程模型。本文基于中国科学院近代物理研究所超算中心的深腾7000G集群,进行GPU通用计算能力和并行编程模型的研究,采用MPI+CUDA多粒度混合编程模型,节点间使用MPI进行通信, 相似文献
3.
三维点云配准在逆向工程中应用广泛,能为古建筑保护实现三维建模提供精确的数据依据。针对大规模多视角古建筑点云数据进行配准,研究了FPFH特征提取的串行算法,设计了三类并行方案,分别为利用基于CPU的并行编程标准OpenMP进行并行优化加速、利用基于GPU的并行计算架构CUDA进行并行优化加速,以及利用CPU/GPU的异构并行,结合OpenMP和CUDA的特点应用于特征子求取。实验结果表明,第三种方案能合理设计并优化特征子求取,获得较为理想的加速比。 相似文献
4.
5.
6.
行(列)转置矩阵的性质 总被引:3,自引:1,他引:2
给出行(列)转置矩阵与行(列)对称矩阵的概念,并对行(列)转置矩阵的行列式、特征值、可逆性、相似性、对称性等进行了研究,得到”阶实方阵与它的行转置矩阵和列转置矩阵三者具有相同的可逆性、行转置矩阵与列转置矩阵相似以及其它一些相关结果. 相似文献
7.
8.
针对地震资料数据处理方法中的三维叠前Kirchhoff深度偏移方法,分析其特点及自动并行化特征,提出一种基于网格环境的自动并行化模型.该模型可以自动分析识别串行程序中潜在的并行性,自动完成串行三维叠前深度偏移(PSDM)程序的分割、并行重构和调度,最终生成串行PSDM程序的并行化源代码. 相似文献
9.
10.
基于OpenMP技术的多核处理器程序的开发实现 总被引:1,自引:0,他引:1
随着多核处理器的日益普及,应用程序能够充分地利用多核处理器的处理能力成为编程的重点。介绍了OpenMP技术的实现机制、使用方法、编程过程中常遇到的问题以及OpenMP技术的优点和缺陷。 相似文献
11.
针对多核机群系统的硬件体系结构特点,提出了节点间MPI消息传递、节点内部OpenMP共享存储的混合并行编程技术。该编程模型结合了两者的优点,更为有效地利用了多核机群的硬件资源。建立了单层混合并行的Jacobi求对称矩阵特征值算法。实验结果表明,与纯MPI算法相比,混合并行算法能够取得更好的加速比。 相似文献
12.
13.
为提高BP神经网络算法的运行效率,利用遗传算法和并行编程思想,提出了Hadoop平台下基于MapReduce的遗传算法优化BP神经网络的并行化设计及实现方法。利用遗传算法优化BP神经网络的初始权值和阈值,提高算法分类准确率;采用MapReduce并行编程模型实现算法的并行化处理,解决BP神经网络在处理大规模样本数据集时存在的硬件开销和通信开销大的问题。选用Caltech256图像数据集,与传统的串行遗传算法优化BP神经网络算法实验对比,验证了并行化GA BP神经网络算法的优越性。 相似文献
14.
周德仿 《黄冈职业技术学院学报》2004,6(3):42-45
本文从分布式存储的并行计算机入手,引出了它的两种并行编程模型 消息传递模型和数据并行模型。在消息传递模型中,并行程序设计的首要考虑是计算问题的分解。于是,从并行算法中的并行分解开始,讨论了基于消息传递的两种分解方法——域分解法和功能分解法。最后最为重要的是,着重讨论了对应于域分解法的数据并行形式和对应于功能分解法的函数并行形式。 相似文献
15.
本文采用OpenMP和CUDA技术,对蒙特卡洛算法进行并行化改进,以充分利用多核处理器和GPU的计算能力,通过对比算法改进前后的性能表现,可以看到采用OpenMP和CUDA技术,能够极大提高计算性能。借鉴该方法,我们可以在个人计算机上改进相关软件计算性能。 相似文献
16.
17.
基于ABEEMσπ模型计算分子的电荷分布时,求解线性方程组是最为耗时的环节.本文针对不同硬件环境下,系数矩阵是稠密、对称非正定矩阵的线性方程组的求解方法进行了比较.详细介绍了串行求解库LAPACK以及基于GPU的CULA库的使用,并给出了基于Bunch-Kaufman方法的串行改进算法以及MPI多机并行求解方法,并分别给出了几种方法的运行时间.用户可以根据不同的硬件条件选择不同的加速算法,以求解系数矩阵是对称非正定矩阵的线性方程组,进而加快分子体系中电荷分布的计算速度. 相似文献
18.
周立群 《齐齐哈尔师范高等专科学校学报》2000,19(3):21-24
本将高等代数的中的“矩阵的转置”定义为“矩阵的主转置”,由此给出矩阵的次转置、行转置、列转置的定义,得出相关结论,并予以严格证明,这对矩阵的深入研究有着极其重要的意义。 相似文献
19.
毋茂盛 《中国现代教育装备》2008,(12):58-60
本文主要研究了对AT89S51单片机进行串行在线编程技术。首先介绍了编程系统的硬件结构,然后讨论了Intel Hex文件格式和系统软件的编制方法,并设计了通过USB口对AT89S51进行在线编程的硬件电路;最后给出了对单片机进行读、写一个字节数据的子程序。 相似文献
20.
毋茂盛 《中国现代教育装备》2008,(12)
本文主要研究了对AT89S51单片机进行串行在线编程技术。首先介绍了编程系统的硬件结构,然后讨论了IntelHex文件格式和系统软件的编制方法,并设计了通过USB口对AT89S51进行在线编程的硬件电路;最后给出了对单片机进行读、写一个字节数据的子程序。 相似文献