您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. DSP中的基于CPU-GPU 异构机群的FDTD 并行算法加速研究(二)

  2. 2 GPU 并行加速算法   GPU 具有高度并行的多流水线架构,使其非常适宜于FDTD 加速运算。与CPU 运算的多次循环逐网格迭代更新方式不同,GPU 可以实现多网格的同时迭代更新,配合GPU 的线程集指令执行机制,可以高效地利用流水线资源,隐藏流处理器与设备内存间的场量读写延时,从而实现FDTD 运算加速。   2.1 GPU 核心函数的并行   2.1.1 数据并行优化   OpenCL 支持按数据并行的编程模型和按任务并行的编程模型。数据并行是一种普遍意义上的并行方式,在程序中
  3. 所属分类:其它

    • 发布日期:2020-10-20
    • 文件大小:189440
    • 提供者:weixin_38514526
  1. DSP中的基于CPU-GPU 异构机群的FDTD 并行算法加速研究(一)

  2. 摘要:时域有限差分法(FDTD)求解电磁学中麦克斯韦方程组是科学与工程计算中一个非常重要的算法。通过对FDTD 求解麦克斯韦旋度方程的直接时间域的分析,给出其基于多个GPU 组成异构机群系统上的并行加速算法,用OpenCL、CUDA 和MPI 编程模型实现了并行程序。在目前的主流NVIDIA 和ATI 的GPU 平台上,加速的并行FDTD 程序相对CPU 串行程序和8 个CPU 核的MPI 并行程序,分别获得了超过8 倍和1.5 倍的加速,并在多个GPU 卡上获得了接近线性加速的扩展性能。  
  3. 所属分类:其它

    • 发布日期:2020-10-20
    • 文件大小:191488
    • 提供者:weixin_38581777