首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
并行编程环境与工具   总被引:2,自引:0,他引:2  
随着多核技术的发展,并行计算及并行编程日益成为人们关注的焦点.文章主要介绍了并行计算的概念及并行机的体系结构,讨论了并行编程的环境与工具.  相似文献   

2.
现有高性的并行计算机大致分为并行向量处理机(PVP)、对称多处理机(SMP)、大规模并行处理机(MPP)、工作站机群(COW)、分布式共享存储处理机(DSM)。这5类计算机各有优缺点,就这5类计算机进行了介绍和比较。  相似文献   

3.
许多工程和物理应用问题的求解通常都归结为求微分方程数值解.考虑到传统的偏微分方程求解算法仅适应于串行机以及单机性能无法满足大规模科学与工程问题的计算需求,针对一类偏微分方程,提出了相应的并行差分格式和并行多分裂迭代求解算法,通过编程将其与红-黑排序、共轭梯度法的加速比和并行效率进行比较,验证了多分裂迭代法在求解偏微分方程中易于实现并行,且具有良好的可扩展性.  相似文献   

4.
针对分子动力学串行计算速度不足问题,设计一种基于MPI+OpenMP的并行编程模型,实现LAMMPS并行计算。从而满足在节点间采用MPI进行消息传递并行,在节点内采用OpenMP共享内存模式多线程并行;最后根据分子动力学自身计算特点,对近邻表的构建以及力的计算进行优化,同时将并行结果和串行结果以及纯OpenMP运行时间和混合模型运行时间作对比。实验结果表明,采用MPI+OpenMP混合并行编程模型不仅能够加快计算速度,而且具有很好的扩展性。  相似文献   

5.
介绍了一种新的基于分布式共享内存系统的并行编程方法--面向视图的并行编程(VOPP).通过实验发现,VOPP的性能优于传统的共享内存编程方法,在某些情况下接近消息传递接口(MPI)的计算效率.在实验基础上.对比分析了VOPP、MPI和TreadMarks之间性能差异的原因.  相似文献   

6.
针对MIC架构处理各种复杂业务时对性能日益增长的要求,为充分利用MIC使用已有编程模型的优势,通过避免内存容量、网络带宽方面的瓶颈增强并行编程的线程扩展性,对并行度、内存空间、数据通信与传递、Cache访问、负载均衡以及循环分块和向量化等方法进行了讨论。通过在内存数据库领域优化性能的应用,对使用三层优化方法发挥MIC众核技术优势进行了分析与展望。  相似文献   

7.
针对基于pvm的桌面PC机联网而成的网络并行计算环境中,处理机的运算速度较快而处理机间的通信相对较慢,以及微机的内存有限的实际情况,从实用的角度出发,给出了基于PVM的网上并行实现特征值问题的二网格法,实现过程中矩阵和向量采用分块储存方式,运用行元素单元贡献法实现了有限元总体刚度矩阵、总体质量矩阵、总体荷载向量的生成,并在1-8台桌面PC机连接成的局域网,PVM3.4 on Win-dowXP,VC 6.0并行计算平台上编程对该算法进行了数值试验,得到了较理想的结果.  相似文献   

8.
本文从分布式存储的并行计算机入手,引出了它的两种并行编程模型 消息传递模型和数据并行模型。在消息传递模型中,并行程序设计的首要考虑是计算问题的分解。于是,从并行算法中的并行分解开始,讨论了基于消息传递的两种分解方法——域分解法和功能分解法。最后最为重要的是,着重讨论了对应于域分解法的数据并行形式和对应于功能分解法的函数并行形式。  相似文献   

9.
随着大规模并行计算机MPP技术的发展,势必牵动并行程序设计的问题,本论述了并行设计的基本概念,知识和理论,并行程序设计的一般方法,关键性的技术问题和难点,期望对并行程序设计的初学有一定启发。  相似文献   

10.
大规模并行处理机的并行程序设计   总被引:1,自引:0,他引:1  
本根据MPP系统结构的特征,介绍两种适合MPP的消息传递方式的并行程序设计方法,讨论了并行程序设计的优化问题,指出并行程序的优化应从数据划分、通信优化和串行程序优化三个方面着手,并介绍并行程序调试技术和步骤。  相似文献   

11.
多核处理器即在一个处理器芯片上集成多个处理器核心,可同时执行多个线程。虽然多核处理器中每个核的时钟频率没有增加,但多个核的并行处理提供了远比单核强大的计算能力,同时,也大大提高了CPU的设计复杂性,基于现代处理器的设计技术,结合程序的实现过程,探讨优化程序性能的几种方法,提升程序编写质量,提高执行效率。  相似文献   

12.
Linux是一个非常优秀的操作系统,其上的PVM也是目前最流行的并行编程语言之一.借助Linux构建并行计算系统,以及在Linux平台下开发PVM并行程序.  相似文献   

13.
1 Introduction Large and complex engineering problems often needmuch computation ti me and storage to run on ordinaryuniprocessor computers . Even if they can be solved ,powerful computation capability is required to obtainaccurate and reliable results within reasonable ti me .Parallel computing can meet requirements of high per-formance computing[1].Various types of parallel hard-ware architectures have been developed and parallelalgorithms adapted to these hardware architecturesproposed[2 ,3…  相似文献   

14.
1 Introduction Large and complex engineering problems often needmuch computation ti me and storage to run on ordinaryuniprocessor computers . Even if they can be solved ,powerful computation capability is required to obtainaccurate and reliable results within reasonable ti me .Parallel computing can meet requirements of high per-formance computing[1].Various types of parallel hard-ware architectures have been developed and parallelalgorithms adapted to these hardware architecturesproposed[2 ,3…  相似文献   

15.
This paper presents a new approach to parallelize 3D lattice Monte Carlo algorithms used in the numerical simulation of polymer on ZiQiang 2000-a cluster of symmetric multiprocessors(SMPs).The combined load for cell and energy calculations over the time step is balanced together to form a single spatial decomposition.Basic aspects and strategies of running Monte Carlo calculations on parallel computers are studied.Different steps involved in porting the software on a parallel architecture based on ZiQiang 2000 running under Linux and MPI are described briefly.It is found that parallelization becomes more advantageous when either the lattice is very large or the model contains many cells and chains.  相似文献   

16.
介绍了计算机标准配置的串行通信端口RS-232在异步传输中的9引脚功能,利用Visual Basic中通信控件及其在Windows平台下的通信软件,给出了实现串行通信控制的设计方法最后结合具体实例给出了基本的通信程序,实验证明,该软件能通过简单的程序完成串行通信控制。  相似文献   

17.
高性能计算与集群系统   总被引:2,自引:0,他引:2  
高性能计算是一个国家综合实力的体现,其主要内容包括高性能计算机、并行算法和并行应用程序等方面。集群系统以其良好的可扩展性和性能价格比,已迅速成为高性能计算领域的主流体系结构。拳文对集群系统的发展、构建、及其应用进行了研究与探讨。  相似文献   

18.
“Fisher最优分割”是一种研究有序样本动态聚类的常用方法,该文利用动态规划的原理,提出了一种对其求解的快速并行算法.通过理论分析和数值实验,证明该算法具有理想的线性加速比,并行效率近似于1.  相似文献   

19.
Dynamic distribution model is one of the best schemes for parallel volume rendering. However, in homogeneous cluster system, since the granularity is traditionally identical, all processors communicate almost simultaneously and computation load may lose balance. Due to problems above, a dynamic distribution model with prime granularity for parallel computing is presented. Granularities of each processor are relatively prime, and related theories are introduced, A high parallel performance can be achieved by minimizing network competition and using a load balancing strategy that ensures all processors finish almost simultaneously, Based on Master-Slave-Gleaner ( MSG) scheme, the parallel Splatting Algorithm for volume rendering is used to test the model on IBM Cluster 1350 system. The experimental results show that the model can bring a considerable improvement in performance, including computation efficiency, total execution time, speed, and load balancing.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号