排序方式: 共有24条查询结果,搜索用时 15 毫秒
1.
传统的光线投射算法能够得到清晰的体绘制图像,但由于其运行量巨大,导致速度慢,性能低。J.Krüger等人提出了基于GPU的光线投射算法大幅度地提高了绘制性能,但在图像融合阶段仍未能充分利用GPU的向量运算的优势。为此,本文将图像融合阶段部分标量运算转换为向量和矩阵运算,绘制性能得到了进一步提升。 相似文献
2.
基于ABEEMσπ模型计算分子的电荷分布时,求解线性方程组是最为耗时的环节.本文针对不同硬件环境下,系数矩阵是稠密、对称非正定矩阵的线性方程组的求解方法进行了比较.详细介绍了串行求解库LAPACK以及基于GPU的CULA库的使用,并给出了基于Bunch-Kaufman方法的串行改进算法以及MPI多机并行求解方法,并分别给出了几种方法的运行时间.用户可以根据不同的硬件条件选择不同的加速算法,以求解系数矩阵是对称非正定矩阵的线性方程组,进而加快分子体系中电荷分布的计算速度. 相似文献
3.
针对扩频信号捕获中计算量大和运算速度慢的问题,提出基于图形处理器(GPU)加速的捕获方法,将基于循环相关的捕获算法转化为计算统一设备架构(CUDA)线程块执行过程,使扩频捕获过程完全在GPU中加速执行,在保持原有扩频信号捕获概率的同时,显著提高了算法的运算速度.实验结果表明,基于GPU的捕获方法有效地提高了系统的执行效率. 相似文献
4.
通过分析AC多模式匹配算法和正则语句搜索匹配在功能上的优劣,研究它们在生成确定性有穷自动机时的相同与差异,融合AC算法和正则语句运用于文本的多模式串匹配,使得AC算法能够识别正则语句,并且保持原有算法在匹配失败后,目标模式串指针不回退且AC自动机回退少的特点,使得算法兼有二者优点. 同时,讨论了在GPU上通过CUDA的并行程序环境实现算法的并行化,并详细比较了在GPU上利用不同类型存储器实现的算法的性能差异. 相似文献
5.
6.
针对多维多时相电离层电子密度数据在Web环境中传输困难而无法满足实时可视化需求以及传统面绘制方法无法反映原始数据场全貌的问题,从电离层电子密度源数据处理出发,使用视频压缩编码方法,实现时间序列数据的高效传输;借助WebGL可编程渲染管道,提出基于GPU加速的电离层电子密度光线投射体绘制方法,并采用自适应步长采样和早期光线终止法,提高可视化质量与体绘制效率;最后,基于开源虚拟地球平台Cesium,实现电离层电子密度的多层动态交互式可视化,验证所提方法的可行性和有效性,为电离层电子密度的科学可视化和辅助研究提供技术支持。 相似文献
7.
由于GPU(Graphic Processing Unit)在图像处理方面的良好性能,国内外已经有很多专家学者在应用GPU进行图像的并行处理.基于CUDA(Compute Unified Device Architecture)这种并行计算平台,利用GPU的强大计算功能对Hough变换中最耗时的部分进行计算.实验表明,这种方法对Hough变换的并行化有很好的加速效果. 相似文献
8.
吴振华 《实验室研究与探索》2011,30(9)
以HDV作为高清视频编码格式,采用CPU+GPU+I/O的构架,以及用千兆以太网和基于iSCSI的IP SAN作为网络结构,对如何构建适合高校教学的网络化高清非编室作了设计.以HDV为核心编码的非线性编辑系统既能满足当前仍有较大需求的标清节目制作,又能为高清节目制作做好充分地准备;CPU+ GPU+ I/O的构架有效利用CPU和GPU的处理能力,简化了非线性编辑系统,进一步降低了影视制作的门槛,从而有利于在高校和其他教育机构中推动影视技术教学;基于iSCSI的IP SAN的构架无论从成本上还是实施难度上,都极具竞争力,它基于成熟的以太网技术,随着万兆以太网的出现,它的应用将更为广泛. 相似文献
9.
本文采用OpenMP和CUDA技术,对蒙特卡洛算法进行并行化改进,以充分利用多核处理器和GPU的计算能力,通过对比算法改进前后的性能表现,可以看到采用OpenMP和CUDA技术,能够极大提高计算性能。借鉴该方法,我们可以在个人计算机上改进相关软件计算性能。 相似文献
10.
串匹配是一个非常经典的问题,本文通过回顾和分析GPU的串匹配算法的国内外研究近况,提出了GPU的串匹配算法的一些新的研究方向,特别是将一些编译解释性的工作放在GPU上实现的思想。 相似文献