首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对分子动力学串行计算速度不足问题,设计一种基于MPI+OpenMP的并行编程模型,实现LAMMPS并行计算。从而满足在节点间采用MPI进行消息传递并行,在节点内采用OpenMP共享内存模式多线程并行;最后根据分子动力学自身计算特点,对近邻表的构建以及力的计算进行优化,同时将并行结果和串行结果以及纯OpenMP运行时间和混合模型运行时间作对比。实验结果表明,采用MPI+OpenMP混合并行编程模型不仅能够加快计算速度,而且具有很好的扩展性。  相似文献   

2.
高性能计算是计算科学的一个分支,研究并行算法和开发相关软件,并致力于开发高性能计算机。目前较为流行的并行程序设计模型为基于消息传递M P I(Message Passing interface)的编程模式,基于共享内存的O p e n M P模式和结合MPI+OpenMP的混合编程模型,以及利用GPU作为并行数据计算设备(GPU计算的模式就是在异构协同处理计算模型中,将CPU与GPU结合起来加以利用,应用程序的串行部分在CPU上运行,而计算任务繁重的部分则由GPU来加速)的MPI+OpenMP+CUDA的三级混合编程模型。本文基于中国科学院近代物理研究所超算中心的深腾7000G集群,进行GPU通用计算能力和并行编程模型的研究,采用MPI+CUDA多粒度混合编程模型,节点间使用MPI进行通信,  相似文献   

3.
王敏 《教育技术导刊》2017,16(11):29-32
三维点云配准在逆向工程中应用广泛,能为古建筑保护实现三维建模提供精确的数据依据。针对大规模多视角古建筑点云数据进行配准,研究了FPFH特征提取的串行算法,设计了三类并行方案,分别为利用基于CPU的并行编程标准OpenMP进行并行优化加速、利用基于GPU的并行计算架构CUDA进行并行优化加速,以及利用CPU/GPU的异构并行,结合OpenMP和CUDA的特点应用于特征子求取。实验结果表明,第三种方案能合理设计并优化特征子求取,获得较为理想的加速比。  相似文献   

4.
为了充分利用多核处理器的硬件资源和计算能力,提出了基于多核并行编程技术的图形数据文件加载优化方案。根据图形数据文件加载的特点,由传统的串行程序改为并行程序,利用多核并行编程模型的思想,找出程序的热点和瓶颈,对其进行优化。实验结果表明,当图形符号数量达到一定数量级之后,优化过后的执行时间较原来串行程序有明显缩短,提高了程序的加速性能,取得了良好的效果。  相似文献   

5.
三次调用二次取中的并行选择算法是基于并行算法模型及串行程序思想的一种算法,编程方式采用VS2005环境中的C++/c#,通过MPICH2系统实现并行算法程序的运行,Windows视窗系统直接为用户良好的操作平台,在算法实现方面,考虑并行算法各影响因素的作用,尤其是通信因子,通过接口技术实现并行算法在网络中处理数据,为并行算法的具体应用提供必要技术支持.  相似文献   

6.
行(列)转置矩阵的性质   总被引:3,自引:1,他引:2  
给出行(列)转置矩阵与行(列)对称矩阵的概念,并对行(列)转置矩阵的行列式、特征值、可逆性、相似性、对称性等进行了研究,得到”阶实方阵与它的行转置矩阵和列转置矩阵三者具有相同的可逆性、行转置矩阵与列转置矩阵相似以及其它一些相关结果.  相似文献   

7.
《滁州学院学报》2017,(5):20-24
利用分子动力学模拟研究的对象越来越复杂,造成编程越来越困难,计算的工作量越来越大,利用面向对象和并行化技术可以有效解决这些问题。本文给出从分子动力学模拟研究的对象和过程抽象出面向对象模型的方法,着重讨论了OpenMP的并行化方法。对实际体系的模拟表明,该程序的并行效率很高,加速比接近于使用的CPU核心数。可以用来对更大的体系进行模拟研究。  相似文献   

8.
针对地震资料数据处理方法中的三维叠前Kirchhoff深度偏移方法,分析其特点及自动并行化特征,提出一种基于网格环境的自动并行化模型.该模型可以自动分析识别串行程序中潜在的并行性,自动完成串行三维叠前深度偏移(PSDM)程序的分割、并行重构和调度,最终生成串行PSDM程序的并行化源代码.  相似文献   

9.
MSComm控件下单片机与计算机串口通信的实现   总被引:2,自引:0,他引:2  
马天才  程全  樊宇 《天中学刊》2008,23(2):60-61
介绍了计算机与单片机之间进行串行通信的一种编程方法,介绍了硬件电路设计时所用到的计算机串行口,分析了软件设计所用到的控件MSComm,给出了该设计的程序流程图和程序的部分源代码.  相似文献   

10.
基于OpenMP技术的多核处理器程序的开发实现   总被引:1,自引:0,他引:1  
随着多核处理器的日益普及,应用程序能够充分地利用多核处理器的处理能力成为编程的重点。介绍了OpenMP技术的实现机制、使用方法、编程过程中常遇到的问题以及OpenMP技术的优点和缺陷。  相似文献   

11.
针对多核机群系统的硬件体系结构特点,提出了节点间MPI消息传递、节点内部OpenMP共享存储的混合并行编程技术。该编程模型结合了两者的优点,更为有效地利用了多核机群的硬件资源。建立了单层混合并行的Jacobi求对称矩阵特征值算法。实验结果表明,与纯MPI算法相比,混合并行算法能够取得更好的加速比。  相似文献   

12.
针对多核机群系统的硬件体系结构特点,提出了节点间MPI消息传递、节点内部OpenMP共享存储的混合并行编程技术。该编程模型结合了两者的优点,更为有效地利用了多核机群的硬件资源。建立了单层混合并行的Jacobi求对称矩阵特征值算法。实验结果表明,与纯MPI算法相比,混合并行算法能够取得更好的加速比。  相似文献   

13.
为提高BP神经网络算法的运行效率,利用遗传算法和并行编程思想,提出了Hadoop平台下基于MapReduce的遗传算法优化BP神经网络的并行化设计及实现方法。利用遗传算法优化BP神经网络的初始权值和阈值,提高算法分类准确率;采用MapReduce并行编程模型实现算法的并行化处理,解决BP神经网络在处理大规模样本数据集时存在的硬件开销和通信开销大的问题。选用Caltech256图像数据集,与传统的串行遗传算法优化BP神经网络算法实验对比,验证了并行化GA BP神经网络算法的优越性。  相似文献   

14.
本文从分布式存储的并行计算机入手,引出了它的两种并行编程模型 消息传递模型和数据并行模型。在消息传递模型中,并行程序设计的首要考虑是计算问题的分解。于是,从并行算法中的并行分解开始,讨论了基于消息传递的两种分解方法——域分解法和功能分解法。最后最为重要的是,着重讨论了对应于域分解法的数据并行形式和对应于功能分解法的函数并行形式。  相似文献   

15.
本文采用OpenMP和CUDA技术,对蒙特卡洛算法进行并行化改进,以充分利用多核处理器和GPU的计算能力,通过对比算法改进前后的性能表现,可以看到采用OpenMP和CUDA技术,能够极大提高计算性能。借鉴该方法,我们可以在个人计算机上改进相关软件计算性能。  相似文献   

16.
针对共享存储式(SMP)并行处理机的特点,以PowerChallengeXL并行处理机为例,对并行编程所涉及到的影响并行性能的因素以及程序并行的方式进行了探讨.结果表明,在编程的过程中,通过减少并行开销、解决负载不均衡以及选择合理的并行粒度,可提高并行程序的加速比,改善机器的运行效能.  相似文献   

17.
基于ABEEMσπ模型计算分子的电荷分布时,求解线性方程组是最为耗时的环节.本文针对不同硬件环境下,系数矩阵是稠密、对称非正定矩阵的线性方程组的求解方法进行了比较.详细介绍了串行求解库LAPACK以及基于GPU的CULA库的使用,并给出了基于Bunch-Kaufman方法的串行改进算法以及MPI多机并行求解方法,并分别给出了几种方法的运行时间.用户可以根据不同的硬件条件选择不同的加速算法,以求解系数矩阵是对称非正定矩阵的线性方程组,进而加快分子体系中电荷分布的计算速度.  相似文献   

18.
本将高等代数的中的“矩阵的转置”定义为“矩阵的主转置”,由此给出矩阵的次转置、行转置、列转置的定义,得出相关结论,并予以严格证明,这对矩阵的深入研究有着极其重要的意义。  相似文献   

19.
本文主要研究了对AT89S51单片机进行串行在线编程技术。首先介绍了编程系统的硬件结构,然后讨论了Intel Hex文件格式和系统软件的编制方法,并设计了通过USB口对AT89S51进行在线编程的硬件电路;最后给出了对单片机进行读、写一个字节数据的子程序。  相似文献   

20.
本文主要研究了对AT89S51单片机进行串行在线编程技术。首先介绍了编程系统的硬件结构,然后讨论了IntelHex文件格式和系统软件的编制方法,并设计了通过USB口对AT89S51进行在线编程的硬件电路;最后给出了对单片机进行读、写一个字节数据的子程序。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号