期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《黑龙江科技信息》2017,(36)

CUDA是由NVIDIA开发的用于通用并行计算的开发平台,通过应用GPU(graphics processing unit)使得计算性能变得非常强大,尤其是密集型数据的并行计算,性能优化更加明显。随着数以百万计的可应用于CUDA的GPU的数量的增加,一些科学家、研究员以及软件开发者正在探寻CUDA的广泛应用,例如图像和视频处理,计算生物学和化学,流体动力学,CT图像重建,地震分析和光线跟踪等等。本文基于光线跟踪的DRR算法的可并行性,在CUDA上设计和实现了并行算法,经过CUDA优化后,可实现交互式数字重建影像,不同分辨率的图像用GPU和CPU分别重建,速度性能能够提升到大约7-40倍,而且图像效果良好。相似文献

2.

基于GPU加速的扩频信号捕获方法

陈源王元钦刘莹《中国科学院研究生院学报》2012,29(2):240-245

针对扩频信号捕获中计算量大和运算速度慢的问题,提出基于图形处理器(GPU)加速的捕获方法,将基于循环相关的捕获算法转化为计算统一设备架构(CUDA)线程块执行过程,使扩频捕获过程完全在GPU中加速执行,在保持原有扩频信号捕获概率的同时,显著提高了算法的运算速度.实验结果表明,基于GPU的捕获方法有效地提高了系统的执行效率. 相似文献

3.

基于GPGPU和CUDA的高速AES算法的实现和优化

顾青高能包珍珍向继《中国科学院研究生院学报》2011,28(6)

随着高性能计算需求的不断增长,人们开始将目光投向具有强大计算能力及高存储带宽的GPU设备.与擅长处理复杂性逻辑事务的CPU相比,GPGPU(general purpose graphic processing unit,通用图形处理器)更适合于大规模数据并行处理.CUDA(compute unified device architecture,统一计算架构)的出现更加速了GPGPU应用面的扩张.基于GPGPU和CUDA技术对AES算法的实现进行加速,得到整体吞吐量6～7Gbit/s的速度.如果不考虑数据加载时间,对于1MB以上的输入规模,吞吐量可以达到20Gbit/s. 相似文献

4.

NVIDIA：超级计算机的未来是ARM而非x86

《黑龙江科技信息》2012,(1)

在未来HPC最看重的能耗比方面,NVIDIA对ARM架构的威力颇为自信,相信HPC计算的未来正在倾向ARM而非x86,该公司目前正和西班牙巴塞罗那超级计算中心合作（BSC）开发全球首款ARM架构HPC试验机,采用NVIDIA Tegra3与CUDA GPU的组合。相似文献

5.

Perlin噪声生成地形的一种高效率并行方法

《科技通报》2016,(3)

针对Perlin噪声叠加法在生成大规模地形时出现运算量大,效率低的问题,提出了一种基于CUDA架构的地形生成并行算法。通过结合Perlin噪声叠加法的特点(对一个点的计算与其他相邻点的计算是不相关的),将每一个地形网格点Perlin噪声值的计算进行并行处理,从而使得地形的生成过程完全在GPU中并行执行。实验结果表明,相比于原算法,并行处理算法较大提高了地形生成的效率,能够满足大规模地形生成的需要。相似文献

6.

格子Boltzmann方法在GPU平台下对多孔介质流动的模拟

《科技风》2016,(22)

GPU有着强大的并行计算能力,现在越来越多的被人应用到科学计算领域了。格子Boltzmann是一种模拟不可压缩流动的计算方法,由于其具有天然的并行性,因此本文利用GPU的并行计算能力,在GPU平台上,利用格子Boltzmann模拟周期性的绕方块多孔介质流动,在保证程序结果的计算精度的情况下,极大的提高了程序计算效率。同时将计算结果同有限元的结果进行比较,也得到了较好的计算结果。相似文献

7.

移动平台GPU通用计算研究综述

周桐王帅严章熙朱虎明《人天科学研究》2014,(10):1-3

近年来,由于ARM、高通和三星等公司的大力推动,嵌入式平台使用的图形处理器（Graphic Processing Unit,GPU）也日趋具有强大的计算能力,越来越多的研究者将其应用于图像处理和数据挖掘等通用计算领域。对国内外在嵌入式和移动平台上的GPU通用计算进行了总结和归纳,发现GPU加速能力和低功耗特性是目前研究的重点。最后以Android操作系统为例,给出了基于开放计算语言（Open Computing Language,OpenCL）的并行计算环境构建思路。相似文献

8.

面向GPU的图像局部模糊检测并行算法研究

陈佳覃唯徐健何希《大众科技》2023,(1):9-13

为解决传统算法在高分辨率图像局部模糊检测方面处理速度较慢的问题，文章提出一种面向GPU的图像局部模糊检测的并行加速方案。利用GPU的强大计算能力加速局部模糊检测中均方差的计算、再模糊处理、均方差比较和清晰区域标记等过程。结果表明，基于GPU的图像局部模糊检测并行算法的性能与基于CPU的串行算法相比，可获得270倍的加速比，能够为大规模实时性图像处理系统的应用设计提供参考。相似文献

9.

基于GPU加速的高斯牛顿法全波形反演

《科技通报》2016,(4)

针对高斯牛顿法地震全波形反演计算量大、计算速度慢的问题,采用图形处理器(GPU)对其加速。高斯牛顿法全波形反演耗时主要集中在波形正演模拟和矩阵乘法计算两个方面,而波形正演算法和矩阵乘法计算在算法特性上都满足并行性的要求。对于波形正演模拟的加速,研究并实现了基于CUDA平台的时域有限差分(FDTD)正演算法。对于矩阵乘法的加速,直接使用计算能力很强的CUB-LAS库来完成计算。在台式PC上对不同模型大小的反演区域做合成数据反演,所用显卡型号为GTX650ti,程序速度提升10~30倍,且随着模型增大,程序的加速比将进一步提高。二维Overthrust截取模型反演算例表明时间成本已经不再是影响高斯牛顿法全波形反演发展的主要问题。相似文献

10.

GPU通用计算研究

倪炜《黑龙江科技信息》2009,(16):75-75

由于图形硬件的快速发展,GPU的通用计算已经成为了一个新的研究领域。分析了GPU编程模型,介绍了使用图形硬件进行通用计算的方法,并把一些常用的算法映射到了GPU上。通过这些算法与CPU上对应的算法进行比较,分析了使用GPU进行通用计算的优势和劣势。相似文献

11.

并行程序设计及实现

张绍辉《人天科学研究》2009,(4)

并行计算是指将顺序执行的计算任务分成可以同时执行的子任务,并行执行这些子任务,从而完成整个计算任务。并行计算不仅仅是一种获得高性能的手段,它同时也具有将计算能力从单个处理器扩展到多个处理器的潜力。相似文献

12.

关于CPU+GPU异构计算模式程序开发中编程方法研究

《科学大众》2014,(10)

与传统的单纯以CPU作为计算部位的同构计算系统相比,CPU+GPU异构计算模式程序优势更加明显,本文主要研究CPU+GPU异构计算模式程序开发中编程方法,总结各种方法的优缺点,希望能为相关人员带来一些帮助。相似文献

13.

基于GPU的游戏粒子系统设计

刘毅《人天科学研究》2011,10(6):85-87

在MMORPG游戏中经常出现同屏显示成千上万的粒子特效,传统引擎虽然使用多线程来计算粒子的运动,但是也很难应付大规模的计算量（考虑到一般配置）,更何况MMORPG中还空出许多CPU去处理逻辑。提出基于GPU进行粒子计算的粒子系统,利用GPU的并行计算多个对象,实现并行化高效的粒子系统。相似文献

14.

基于GPU的数字图象处理

谭久宏周维超吴钦章《科教文汇》2006,(4)

图形处理器(GPU)的飞速发展和革新成为计算机硬件发展的一大亮点。当前的GPU具有一定的并行性和可编程性,在诸如数字图象处理的通用计算领域的应用有着巨大的潜力。本文介绍了GPU发展的一些技术特点,分析和总结了用其实现数字图象处理算法的一些基本途径。相似文献

15.

卖命工作的显卡

《科技新时代》2009,(4):22-22

它是什么 GPU计算：利用电脑的图形处理器执行其他任务。相似文献

16.

改进的CPU-GPU异构平台临界阈值分析方法

冯灵霞张良《科技通报》2014,(8)

CPU-GPU异构平台临界阈值的精确确定是决定GPU并行程序运算性能的关键,传统的临界阈值确定方法采用Lyapunov指数算法,在系统相轨迹过零周期数变相时系统状态不稳,零极点出现漂移,导致临界阈值检测精度不高。提出一种改进的Lyapunov指数算法下的CPU-GPU异构平台临界阈值确定方法,实现对不同幅值递增步长下的系统相变阈值的计算。仿真实验表明,采用该改进算法求解CPU-GPU异构平台临界阈值,优化GPU并行驱动程序,算法复杂度更低,计算精度较高,能有效提高GPU平台并行运算加速比,高精度阈值能在短时间内被准确确定。相似文献

17.

一种基于OPENACC指令加速的均值模糊算法

胡玉贵《人天科学研究》2013,(1):59-61

目前,计算机系统普遍使用GPGPU设备加速计算,但使用底层API进行加速计算繁琐而又缺乏效率,运用基于指令的高级抽象编程可以解决这个问题。运用均值模糊算法体验OPENACC的用法,OPENACC通过指令把c或c＋＋中的计算紧密代码转移到GUP中。比较了分别使用CPU、OPENACC、CUDA实现均值模湖算法的性能表现,虽然CUDA有不错的性能,但相对于低下的开发效率和陡峭的学习曲线而言,OPENACC只用十几行代码就可以取得可观的加速比,而且随着编译器和硬件技术的发展,指令制导编译有越来越大的发展空间。相似文献

18.

基于多GPU的千万级高维空间实时检索

周迪斌蒋健明胡斌张量《科技通报》2013,(1):118-123

海量高维数据的近邻检索一直是多媒体信息领域的重要研究课题。本文提出一种基于多GPU的并行高维空间距离检索排序算法,通过并行优化空间距离计算及排序过程,并充分利用GPU硬件特性和众多的流处理器单元,算法能实现百万级的高维数据的实时检索。在此基础上,研究并利用多GPU架构,提升并行效率,拓展实时数据查询的数据规模。实验结果表明,本文算法可达到千万级别高维数据的实时精确检索,极大地拓展了高维检索的应用范围。相似文献

19.

一种基于GPU的快速Kirsch边缘检测算法

黄轩《中国科技信息》2012,(22):83-84

传统的Kirsch边缘检测算法的优化和实现都是针对常用处理器提出的。根据Kirsch算法的可并行计算的特点,本文提出了一种基于图形处理器GPU的快速Kirsch算法。快速算法根据GPU的并行结构和硬件特点,采用了纹理存储技术、多点访问技术和对称计算技术三种加速技术,优化了数据存储结构,提高了数据访问效率,降低了算法复杂度。实验表明,采用基于GPU的算法可将对图像的处理速度提高到传统Kirsch边缘检测算法的10倍以上。相似文献

20.

基于计算思维的小学生Scratch课程设计分析

《科教文汇》2019,(3)

现代社会信息技术对人类的影响无处不在。电子产品的不断更新和网络速度的加快,一方面改变了人们的衣食住行,另一方面也对人们的思维提出了新的容量要求。它需要传统的技能,如阅读、写作和算术,也需要新的能力——计算思维,以适应当今社会的快速发展。同时,随着中小学信息技术课核心素养的提出,如何在中小学信息技术课程设计中体现计算思维,提高中小学生计算思维能力,成为了信息技术老师进一步学习的内容和思考的方向。相似文献