期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

谭久宏周维超吴钦章《科教文汇》2006,(4)

图形处理器(GPU)的飞速发展和革新成为计算机硬件发展的一大亮点。当前的GPU具有一定的并行性和可编程性,在诸如数字图象处理的通用计算领域的应用有着巨大的潜力。本文介绍了GPU发展的一些技术特点,分析和总结了用其实现数字图象处理算法的一些基本途径。相似文献

2.

移动平台GPU通用计算研究综述

周桐王帅严章熙朱虎明《人天科学研究》2014,(10):1-3

近年来,由于ARM、高通和三星等公司的大力推动,嵌入式平台使用的图形处理器（Graphic Processing Unit,GPU）也日趋具有强大的计算能力,越来越多的研究者将其应用于图像处理和数据挖掘等通用计算领域。对国内外在嵌入式和移动平台上的GPU通用计算进行了总结和归纳,发现GPU加速能力和低功耗特性是目前研究的重点。最后以Android操作系统为例,给出了基于开放计算语言（Open Computing Language,OpenCL）的并行计算环境构建思路。相似文献

3.

一种基于GPU的快速Kirsch边缘检测算法

黄轩《中国科技信息》2012,(22):83-84

传统的Kirsch边缘检测算法的优化和实现都是针对常用处理器提出的。根据Kirsch算法的可并行计算的特点,本文提出了一种基于图形处理器GPU的快速Kirsch算法。快速算法根据GPU的并行结构和硬件特点,采用了纹理存储技术、多点访问技术和对称计算技术三种加速技术,优化了数据存储结构,提高了数据访问效率,降低了算法复杂度。实验表明,采用基于GPU的算法可将对图像的处理速度提高到传统Kirsch边缘检测算法的10倍以上。相似文献

4.

引入相似性度量的GPU实时图形跟踪渲染技术

《科技通报》2015,(12)

提出一种基于目标分布场相似性度量的实时图形跟踪渲染算法。使用Open Flight的建模环境提供GPU实时图形渲染三维图形观察器,得到一个有二维层次的结构图,进行目标分布场设计,结合静态视点图像的运动方程,通过对图像自然分层,保留原始图像的基本信息,为了在跟踪中使分布场能适应各种复杂场景,需要对原始的分布场进行高斯平滑,通过目标分布场相似性度量,实现GPU实时图形跟踪渲染。仿真结果表明,采用该算法进行实时图形渲染,可以提高渲染跟踪效率,搜索时间短,误差率较低,提高了图形的渲染真实感。相似文献

5.

基于GPU加速的扩频信号捕获方法

陈源王元钦刘莹《中国科学院研究生院学报》2012,29(2):240-245

针对扩频信号捕获中计算量大和运算速度慢的问题,提出基于图形处理器(GPU)加速的捕获方法,将基于循环相关的捕获算法转化为计算统一设备架构(CUDA)线程块执行过程,使扩频捕获过程完全在GPU中加速执行,在保持原有扩频信号捕获概率的同时,显著提高了算法的运算速度.实验结果表明,基于GPU的捕获方法有效地提高了系统的执行效率. 相似文献

6.

基于GPGPU和CUDA的高速AES算法的实现和优化

顾青高能包珍珍向继《中国科学院研究生院学报》2011,28(6)

随着高性能计算需求的不断增长,人们开始将目光投向具有强大计算能力及高存储带宽的GPU设备.与擅长处理复杂性逻辑事务的CPU相比,GPGPU(general purpose graphic processing unit,通用图形处理器)更适合于大规模数据并行处理.CUDA(compute unified device architecture,统一计算架构)的出现更加速了GPGPU应用面的扩张.基于GPGPU和CUDA技术对AES算法的实现进行加速,得到整体吞吐量6～7Gbit/s的速度.如果不考虑数据加载时间,对于1MB以上的输入规模,吞吐量可以达到20Gbit/s. 相似文献

7.

计算机图形学新的发展趋向

石教英何志均《科技通报》1986,(1)

一、计算机图形学发展概述计算机图形学从六十年代初形成,至今已经发展成为包括图形硬件没备,图形软件系统和图形专用算法等为研究内容的一门十分丰富的科学。计算机图形学主要研究图形(图象)的生成。目前日趋成熟的商品化图形硬件设备和通用图形软件系统已能方便地生成各种线画图形和逼真的三维彩色图象。计算机图形学提供的图形生成理论和方法是应用领域发展的基相似文献

8.

基于多GPU的千万级高维空间实时检索

周迪斌蒋健明胡斌张量《科技通报》2013,(1):118-123

海量高维数据的近邻检索一直是多媒体信息领域的重要研究课题。本文提出一种基于多GPU的并行高维空间距离检索排序算法,通过并行优化空间距离计算及排序过程,并充分利用GPU硬件特性和众多的流处理器单元,算法能实现百万级的高维数据的实时检索。在此基础上,研究并利用多GPU架构,提升并行效率,拓展实时数据查询的数据规模。实验结果表明,本文算法可达到千万级别高维数据的实时精确检索,极大地拓展了高维检索的应用范围。相似文献

9.

基于CUDA的数字影像重建算法性能优化

《黑龙江科技信息》2017,(36)

CUDA是由NVIDIA开发的用于通用并行计算的开发平台,通过应用GPU(graphics processing unit)使得计算性能变得非常强大,尤其是密集型数据的并行计算,性能优化更加明显。随着数以百万计的可应用于CUDA的GPU的数量的增加,一些科学家、研究员以及软件开发者正在探寻CUDA的广泛应用,例如图像和视频处理,计算生物学和化学,流体动力学,CT图像重建,地震分析和光线跟踪等等。本文基于光线跟踪的DRR算法的可并行性,在CUDA上设计和实现了并行算法,经过CUDA优化后,可实现交互式数字重建影像,不同分辨率的图像用GPU和CPU分别重建,速度性能能够提升到大约7-40倍,而且图像效果良好。相似文献

10.

基于TI图形驱动库的嵌入式图形界面设计

王茜《人天科学研究》2011,10(4):166-167

为了加快嵌入式图形界面的开发,TI在基于arm cortex m3内核的Stellaris平台上推出了图形驱动库（Graphics Library）。首先介绍了TI图形驱动库的特点,然后通过分析图形驱动库的运行机制,给出了一种在Stel-laris平台上使用TI图形驱动库进行嵌入式图形界面设计的通用方法。相似文献

11.

基于GPU的Bor?vka最小生成树改进算法

《科技通报》2017,(2)

为了提高Bor?vka最小生成树算法的效率,本文基于NVIDIA GPU提出一种并行Bor?vka算法,设计了适用于GPU通用并行计算架构的邻接表图存储方式,通过避免Bor?vka算法每次迭代后的破圈操作以及合并超节点后的数据重组操作,并将算法中具有并行特性的部分移植到GPU并行执行,从而提高了算法的效率。实验表明,相比于CPU版Bor?vka算法,该算法具有较为明显的加速效果。相似文献

12.

基于CPU+GPU异构计算编程研究

《黑龙江科技信息》2020,(1)

本文分析了CPU+GPU异构编程方式及其在计算系统编程上的困境,需要考虑CPU模式中的X86编程习惯,双精度性能有限,提出了目前采用的程序开发方式,包括底层图形API的开发方式,低层次抽象的轻量级编程工具,高层次抽象函数库与模板库等,分析目前编程方法运用的适用场合及其中的局限性,为CPU+GPU异构计算的编程方法研究提供了一定的参考意见。相似文献

13.

卖命工作的显卡

《科技新时代》2009,(4):22-22

它是什么 GPU计算：利用电脑的图形处理器执行其他任务。相似文献

14.

分布式密码计算平台的架构设计及其实现

程贯中林东岱张珍《中国科学院研究生院学报》2004,21(2):218-226

分析了常见的密码算法对于分布式计算平台的需求 ,定义了通用的任务表示格式 ,使用DCOM技术设计了一个针对密码计算的分布式通用平台及其外挂算法模块 ;并实现了两种常见的密码攻击算法 ,给出了测试结果 . 相似文献

15.

基于GPU加速的高斯牛顿法全波形反演

《科技通报》2016,(4)

针对高斯牛顿法地震全波形反演计算量大、计算速度慢的问题,采用图形处理器(GPU)对其加速。高斯牛顿法全波形反演耗时主要集中在波形正演模拟和矩阵乘法计算两个方面,而波形正演算法和矩阵乘法计算在算法特性上都满足并行性的要求。对于波形正演模拟的加速,研究并实现了基于CUDA平台的时域有限差分(FDTD)正演算法。对于矩阵乘法的加速,直接使用计算能力很强的CUB-LAS库来完成计算。在台式PC上对不同模型大小的反演区域做合成数据反演,所用显卡型号为GTX650ti,程序速度提升10~30倍,且随着模型增大,程序的加速比将进一步提高。二维Overthrust截取模型反演算例表明时间成本已经不再是影响高斯牛顿法全波形反演发展的主要问题。相似文献

16.

CRC算法在计算机网络通信差错检测控制中的应用

张岚《黑龙江科技信息》2015,(18)

CRC算法在对数据包进行检测时候使用的是for循环语句,对每一个字节进行计算,因此计算相对来说比较简单,大大的节省了校验的速度,相对比的算法来说,CRC算法所占的储存空间虽然会有所增加,但是随着信息产业的不断发展,硬件储存容量的不断增加,这种牺牲空间换取计算时间和计算速度的方式是非常值得的。本文则对CRC算法在计算机网络通信差错检测控制中的应用策略分析。相似文献

17.

基于开放计算语言的磁共振成像最小二乘算法并行加速

《科技广场》2017,(1)

磁共振成像(Magnetic Resonance Imaging,简称MRI)技术已被广泛应用于现代医学的临床诊断上。MRI多采用最小二乘(Least Squares,简称LS)算法通过非笛卡尔扫描轨迹进行医学图像的重构。LS算法需要计算所谓的向量FHd和矩阵Q以重构图像。对于LS算法,计算向量FHd和矩阵Q占据了算法绝大部分工作量。本文基于开放计算语言(Open Computing Language,简称Open CL)编程框架,在中央处理器和图形处理器上对LS算法计算向量FHd实现并行化,且在使用内建函数、访存和分割循环等方面进行优化,得到近300倍的加速比。本文所提出的并行加速方案通过简单修改可用于计算矩阵Q。相似文献

18.

我国首套单精度千万亿次超级计算系统研制成功

下载免费PDF全文

《中国科学院院刊》2009,(3):315-316

超级计算能力不仅体现了一个国家在科学研究方面的实力,而且决定了工程技术和国家安全方面的竞争力,已成为各大国激烈竞争的科技制高点之一。在计算硬件技术迅速发展的同时,通用超级计算投资大、能耗高、算法开发滞后、实际效率低的问题日益突出;而针对各种特定算法设计的专用计算机研发成本高、无法成批生产,经济性差。这两方面的问题成为提升超级计算能力的瓶颈。相似文献

19.

面向GPU的图像局部模糊检测并行算法研究

陈佳覃唯徐健何希《大众科技》2023,(1):9-13

为解决传统算法在高分辨率图像局部模糊检测方面处理速度较慢的问题，文章提出一种面向GPU的图像局部模糊检测的并行加速方案。利用GPU的强大计算能力加速局部模糊检测中均方差的计算、再模糊处理、均方差比较和清晰区域标记等过程。结果表明，基于GPU的图像局部模糊检测并行算法的性能与基于CPU的串行算法相比，可获得270倍的加速比，能够为大规模实时性图像处理系统的应用设计提供参考。相似文献

20.

格子Boltzmann方法在GPU平台下对多孔介质流动的模拟

《科技风》2016,(22)

GPU有着强大的并行计算能力,现在越来越多的被人应用到科学计算领域了。格子Boltzmann是一种模拟不可压缩流动的计算方法,由于其具有天然的并行性,因此本文利用GPU的并行计算能力,在GPU平台上,利用格子Boltzmann模拟周期性的绕方块多孔介质流动,在保证程序结果的计算精度的情况下,极大的提高了程序计算效率。同时将计算结果同有限元的结果进行比较,也得到了较好的计算结果。相似文献