共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
传统的Kirsch边缘检测算法的优化和实现都是针对常用处理器提出的。根据Kirsch算法的可并行计算的特点,本文提出了一种基于图形处理器GPU的快速Kirsch算法。快速算法根据GPU的并行结构和硬件特点,采用了纹理存储技术、多点访问技术和对称计算技术三种加速技术,优化了数据存储结构,提高了数据访问效率,降低了算法复杂度。实验表明,采用基于GPU的算法可将对图像的处理速度提高到传统Kirsch边缘检测算法的10倍以上。 相似文献
4.
5.
针对扩频信号捕获中计算量大和运算速度慢的问题,提出基于图形处理器(GPU)加速的捕获方法,将基于循环相关的捕获算法转化为计算统一设备架构(CUDA)线程块执行过程,使扩频捕获过程完全在GPU中加速执行,在保持原有扩频信号捕获概率的同时,显著提高了算法的运算速度.实验结果表明,基于GPU的捕获方法有效地提高了系统的执行效率. 相似文献
6.
随着高性能计算需求的不断增长,人们开始将目光投向具有强大计算能力及高存储带宽的GPU设备.与擅长处理复杂性逻辑事务的CPU相比,GPGPU(general purpose graphic processing unit,通用图形处理器)更适合于大规模数据并行处理.CUDA(compute unified device architecture,统一计算架构)的出现更加速了GPGPU应用面的扩张.基于GPGPU和CUDA技术对AES算法的实现进行加速,得到整体吞吐量6~7Gbit/s的速度.如果不考虑数据加载时间,对于1MB以上的输入规模,吞吐量可以达到20Gbit/s. 相似文献
7.
一、计算机图形学发展概述计算机图形学从六十年代初形成,至今已经发展成为包括图形硬件没备,图形软件系统和图形专用算法等为研究内容的一门十分丰富的科学。计算机图形学主要研究图形(图象)的生成。目前日趋成熟的商品化图形硬件设备和通用图形软件系统已能方便地生成各种线画图形和逼真的三维彩色图象。计算机图形学提供的图形生成理论和方法是应用领域发展的基 相似文献
8.
9.
《黑龙江科技信息》2017,(36)
CUDA是由NVIDIA开发的用于通用并行计算的开发平台,通过应用GPU(graphics processing unit)使得计算性能变得非常强大,尤其是密集型数据的并行计算,性能优化更加明显。随着数以百万计的可应用于CUDA的GPU的数量的增加,一些科学家、研究员以及软件开发者正在探寻CUDA的广泛应用,例如图像和视频处理,计算生物学和化学,流体动力学,CT图像重建,地震分析和光线跟踪等等。本文基于光线跟踪的DRR算法的可并行性,在CUDA上设计和实现了并行算法,经过CUDA优化后,可实现交互式数字重建影像,不同分辨率的图像用GPU和CPU分别重建,速度性能能够提升到大约7-40倍,而且图像效果良好。 相似文献
10.
为了加快嵌入式图形界面的开发,TI在基于arm cortex m3内核的Stellaris平台上推出了图形驱动库(Graphics Library)。首先介绍了TI图形驱动库的特点,然后通过分析图形驱动库的运行机制,给出了一种在Stel-laris平台上使用TI图形驱动库进行嵌入式图形界面设计的通用方法。 相似文献
11.
12.
14.
分析了常见的密码算法对于分布式计算平台的需求 ,定义了通用的任务表示格式 ,使用DCOM技术设计了一个针对密码计算的分布式通用平台及其外挂算法模块 ;并实现了两种常见的密码攻击算法 ,给出了测试结果 . 相似文献
15.
《科技通报》2016,(4)
针对高斯牛顿法地震全波形反演计算量大、计算速度慢的问题,采用图形处理器(GPU)对其加速。高斯牛顿法全波形反演耗时主要集中在波形正演模拟和矩阵乘法计算两个方面,而波形正演算法和矩阵乘法计算在算法特性上都满足并行性的要求。对于波形正演模拟的加速,研究并实现了基于CUDA平台的时域有限差分(FDTD)正演算法。对于矩阵乘法的加速,直接使用计算能力很强的CUB-LAS库来完成计算。在台式PC上对不同模型大小的反演区域做合成数据反演,所用显卡型号为GTX650ti,程序速度提升10~30倍,且随着模型增大,程序的加速比将进一步提高。二维Overthrust截取模型反演算例表明时间成本已经不再是影响高斯牛顿法全波形反演发展的主要问题。 相似文献
16.
CRC算法在对数据包进行检测时候使用的是for循环语句,对每一个字节进行计算,因此计算相对来说比较简单,大大的节省了校验的速度,相对比的算法来说,CRC算法所占的储存空间虽然会有所增加,但是随着信息产业的不断发展,硬件储存容量的不断增加,这种牺牲空间换取计算时间和计算速度的方式是非常值得的。本文则对CRC算法在计算机网络通信差错检测控制中的应用策略分析。 相似文献
17.
《科技广场》2017,(1)
磁共振成像(Magnetic Resonance Imaging,简称MRI)技术已被广泛应用于现代医学的临床诊断上。MRI多采用最小二乘(Least Squares,简称LS)算法通过非笛卡尔扫描轨迹进行医学图像的重构。LS算法需要计算所谓的向量FHd和矩阵Q以重构图像。对于LS算法,计算向量FHd和矩阵Q占据了算法绝大部分工作量。本文基于开放计算语言(Open Computing Language,简称Open CL)编程框架,在中央处理器和图形处理器上对LS算法计算向量FHd实现并行化,且在使用内建函数、访存和分割循环等方面进行优化,得到近300倍的加速比。本文所提出的并行加速方案通过简单修改可用于计算矩阵Q。 相似文献
18.
19.