学科分类
/ 25
500 个结果
  • 简介:摘要近年来,随着通用图形处理器技术的发展,单个GPU的浮点性能比CPU高一个量级以上。采用GPU实现CFD计算为快速仿真分析提供了有力的途径,但目前GPU上的CFD计算方法尚未成熟,仍有大量的相关数值计算问题有待研究和完善。本文采用CUDA技术,针对NVIDIATeslaK40cGPU,编写了基于有限体积法的二维CFD求解程序。着重研究了网格排序、存储器对齐、数据存储格式对计算效率的影响。

  • 标签: 网格排序算法 行压缩稀疏矩阵格式 广义极小残量法
  • 简介:在本系列文章的第一部分,我展示了第一个简单的CUDA程序——moveArrays.cu,使您熟悉用于构建和执行程序的CUDA工具。本文在第一个示例的基础上添加了几行代码,以便在CUDA设备上进行简单的计算——特别是在浮点数组中以1为增量增加每个元素。在开始更高级的话题之前,您首先需要了解:

  • 标签: CUDA工具 数据处理 计算方式 计算机技术
  • 简介:本文针对NLM图像去噪算法可并行化计算的特点,在CUDA平台下对其进行加速,达到了实时的效果。

  • 标签: GPU CUDA NLM算法 图像去噪
  • 简介:平行程序与不同线级的并行(TLP)由代码节的系列组成。作为结果,在一个平行程序的一个线程例如在CUDA程序的一个GPU内核,仍然包含顺序的代码和平行的环,是相当普通的。为了利用如此的平行,循环,最近的开普勒·恩威迪亚体系结构介绍动态并行,它允许一个GPU线程开始另一个GPU内核,从而减少从一个中央处理器运行内核的开销。与动态并行,然而,一个父母线程能仅仅通过全球存储器与它的孩子线程交流,运行GPU内核的开销甚至在GPU以内是重要的。在这份报纸,我们首先学习包含这些基准没有的平行的环,和热点的一套GPGPU基准一个很高的环计数或TLP的高度。因而,用动态并行利用如此的平行的环的好处也被限制抵消它的开销。我们然后介绍我们的建议答案在CUDA利用嵌套的并行,叫作CUDA-NP。与CUDA-NP,当一个GPU程序开始时,我们开始启用线程的一个高数字,并且使用控制流动为不同代码节激活线程的不同数字。我们用一条基于指令的编译器途径实现我们的建议CUDA-NP框架。为一个GPU核,一个应用程序开发者仅仅需要为可并行化的代码节增加象OpenMP一样编译指示。然后,我们的CUDA-NP编译器自动地产生优化GPU内核。它支持减小和扫描原语,探索不同方法散布平行的环重复进线程,并且高效地管理在薄片上资源。我们的实验证明为一套GPGPU基准,它已经被优化了并且包含嵌套的并行,我们的建议CUDA-NP框架进一步平均到多达6.69次和2.01次改进表演。

  • 标签: 应用程序开发 并行程序 线程 嵌套 并行循环 NVIDIA
  • 简介:硅酸盐水泥水化过程的复杂性使得基于传统方法的水化动力学方程人工推导极为困难.通过进化计算方法可以从观测到的硅酸盐水泥水化程度时间序列数据中自动萃取水化动力学方程,然而其时间复杂度很高.因此,可以利用CUDA计算架构对进化过程进行并行加速来减少运算时间.实验结果表明,采用CUDA架构可以获得较高的加速比,所得到的仿真结果可以很好地吻合观测到的水化程度时间序列数据.

  • 标签: 硅酸盐水泥 水化动力学方程 CUDA计算架构 进化计算
  • 简介:摘要随着雷达技术高速的发展,针对雷达终端的雷达信号处理要求也随之提高,高速发展的可编程图形处理单元(GPU)为雷达信号处理实时性提供了一个新的平台。基于CUDA架构的GPU采用强大并行能力和极高的计算效率,对CA-CFAR算法迭代而大量重复的工作,并行完成,缩短数据处理时间,满足雷达信号的实时性,同时降低系统占用率,提高性能。

  • 标签: GPU 恒虚警概率检测 并行计算
  • 简介:WehavesuccessfullyportedanarbitraryhighorderdiscontinuousGalerkinmethodforsolvingthethreedimensionalisotropicelasticwaveequationonunstructuredtetrahedralmeshestomultipleGraphicProcessingUnits(GPUs)usingtheComputeUnifiedDeviceArchitecture(CUDA)ofNVIDIAandMessagePassingInterface(MPI)andobtainedaspeedupfactorofabout28.3forthesingle-precisionversionofourcodesandaspeedupfactorofabout14.9forthedouble-precisionversion.TheGPUusedinthecomparisonsisNVIDIATeslaC2070Fermi,andtheCPUusedisIntelXeonW5660.Toeffectivelyoverlapinter-processcommunicationwithcomputation,weseparatetheelementsoneachsubdomainintoinnerandouterelementsandcompletethecomputationonouterelementsandfilltheMPIbufferfirst.WhiletheMPImessagestravelacrossthenetwork,theGPUperformscomputationoninnerelements,andallothercalculationsthatdonotuseinformationofouterelementsfromneighboringsubdomains.Asignificantportionofthespeedupalsocomesfromacustomizedmatrix–matrixmultiplicationkernel,whichisusedextensivelythroughoutourprogram.PreliminaryperformanceanalysisonourparallelGPUcodesshowsfavorablestrongandweakscalabilities.

  • 标签: 间断GALERKIN方法 GPU MPI 传播模拟 地震波 消息传递接口
  • 简介:<正>夏天是休憩房屋的季节,或者在适当的时候,修理之前要先进行破坏。当要砸碎什么的时候,试试看下面这些工具

  • 标签: 褥州
  • 简介:通过评价学生的问题意识,教师可以了解学生在主题确定阶段学习了什么,如学生在提出问题、描述问题及分解主题方面的能力有哪些发展,存在哪些问题,并通过评价得到诊断性的反馈,让学生能够对此阶段的教学获得真实、及时而准确的判断,从而引导教师寻找更优化的教学方法。

  • 标签: 评价工具 教学方法 问题意识 提出问题 学生 教师
  • 简介:一只僧帽猴把坚果轻轻地放在一根木头上。坚果的大小跟猴子的拳头差不多。这只猴子找到一块大石头,把它举到坚果上方,然后对准坚果砸下去。“砰”的一声,坚果从木头上弹了出去。

  • 标签: 工具 坚果 猴子
  • 简介:幻影:快到十一长假了,不知道各位黑迷们又准备怎么过呢?最近一直有狙击波横行,所以本期工具黑客里特别添加了这个专杀工具,另外还有微软提供的反间谍软件和各种新式木马和后门程序等等.大家快试试吧。

  • 标签: 专杀工具 黑客 反间谍软件 后门程序 幻影 木马
  • 简介:当历史的车轮转过悠长的五千年.当我们用我们的满目辉煌去看待历史时,我们是否想到过她的背后埋葬了多少有为的志士和无奈的人生?有这么一批人,他们反抗过——反抗王权.反抗霸权,反抗君主专制,但他们却又如此忠诚——忠于王权,忠于霸道,忠于君主专制。他们留名青史,我们也为他们歌功颂德.可他们又得到了什么?反抗在时间消磨下褪尽,

  • 标签: 应尤佳 《工具人生》 中学 语文 议论文 阅读欣赏
  • 简介:对于制造大理石的朋友们,这个工具是制造奇迹的好方法。如果你想做一个圆球,只要用这个工具套住他然后来来回回的磨。不用多久你就可以得到一个完美的石弹子。

  • 标签: 工具 圆形 大理石 制造