您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. OpenMp循环并行化

  2. 循环并行化是使用OpenMp来并行化程序的最重要的部分,它是并行区域编程的一个特例。
  3. 所属分类:C

    • 发布日期:2011-12-06
    • 文件大小:125952
    • 提供者:zz841215123
  1. 800Mbps准循环LDPC码译码器的FPGA实现

  2. 本文提出了一种适用于准循环低密度校验码的低复杂度的高并行度译码器架构。通常准循环低密度校验码不适于设计有效的高并行度高吞吐茸译码器。我们通过利用准循环低密度校验码的奇偶校验矩阵的结构特点,将其转化为块 准循环结构,从而能够并行化处理译码算法的行与列操作。使用这个架构,我们在Xilinx Virtex-5 LX330 FPGA上实现了(8176,7154)有限几何LDPC码的译码器,在15次迭代的条件下其译码吞吐量达到800Mbps。
  3. 所属分类:硬件开发

    • 发布日期:2014-03-09
    • 文件大小:591872
    • 提供者:sunnyapi163com
  1. Cannon乘法的MPI实现

  2. cannon算法是矩阵的并行乘法,属于数值并行算法MPI编程实现一篇,其中关于数值并行算法MPI编程由于要处理的数据量巨大,程序循环次数多,对于串行而言,处理时间将非常长,将其并行化非常必要。
  3. 所属分类:专业指导

    • 发布日期:2014-07-25
    • 文件大小:1048576
    • 提供者:nihate
  1. 并行计算课程设计(报告+代码+可执行文件)

  2. 1. 设计目的、意义(功能描述) 蒙特·卡罗方法(Monte Carlo method),也称统计模拟方法,是二十世纪四十年代中期由于科学技术的发展和电子计算机的发明,而被提出的一种以概率统计理论为指导的一类非常重要的数值计算方法。本次大作业主要是对蒙特·卡罗方法进行并行处理,通过OpenMP、MPI、.NET、Java、Win32API等一系列并行技术和并行机制对该算法进行并行处理,从而也进一步熟悉了蒙特·卡罗方法的串行算法和并行算法,实现了用蒙特·卡罗方法计算出半径为1单位的球体的体积,体
  3. 所属分类:其它

    • 发布日期:2016-01-11
    • 文件大小:669696
    • 提供者:u013255737
  1. 并行计算课程设计(代码+执行文件+文档)

  2. 1. 设计目的、意义(功能描述) 蒙特·卡罗方法(Monte Carlo method),也称统计模拟方法,是二十世纪四十年代中期由于科学技术的发展和电子计算机的发明,而被提出的一种以概率统计理论为指导的一类非常重要的数值计算方法。本次大作业主要是对蒙特·卡罗方法进行并行处理,通过OpenMP、MPI、.NET、Java、Win32API等一系列并行技术和并行机制对该算法进行并行处理,从而也进一步熟悉了蒙特·卡罗方法的串行算法和并行算法,实现了用蒙特·卡罗方法计算出半径为1单位的球体的体积,体
  3. 所属分类:其它

    • 发布日期:2016-01-11
    • 文件大小:12582912
    • 提供者:u013255737
  1. 计算机结构并行化程序的替代方法的研究.pdf

  2. 本文提出了一种并行化程序的替代方法,比实际操作系统的基于API的方法(如OpenMP和MPI)更适合于多核处理器。该方法依赖于并行化硬件和适应的编程风格。它释放并捕获了构造级并行(ILP)。提出了一种多核设计,其中核是多线程的,并且能够分叉新线程。编程风格基于功能。硬件在每个函数调用时创建一个并发线程。编程风格和硬件创造了释放ILP的条件,通过消除calland之间的体系结构依赖性以及返回后的延续。我们说明了总和减少,矩阵乘法和排序的方法。我们测量并行运行的ILP,并表明它足够高,可以提供数千
  3. 所属分类:其它

    • 发布日期:2019-07-23
    • 文件大小:2097152
    • 提供者:weixin_39840588
  1. “神威·太湖之光”上Tend_lin并行优化

  2. 大气环流模式是中科院地球系统模式中最为复杂的模式,在当前主流的众核异构平台上开展大气环流模式的众核并行化是高性能计算的热点研究问题。针对AGCM4.0热点程序动力框架的适应过程Tend_lin,利用神威OpenACC编程模型在"神威·太湖之光"高性能计算平台上实现并行化,并从循环分布、循环分块、数据传输的表达、函数调用的从核化等方面提升应用性能。详细讨论了不同场景下的数据传输表达,对比测试了不同分块尺寸对程序性能的影响。相比主核串行,两种测试规模下,Tend_lin应用的单核组多线程并行均获得6
  3. 所属分类:其它

    • 发布日期:2020-07-25
    • 文件大小:1048576
    • 提供者:weixin_38522029
  1. 关联规则挖掘算法的多核并行优化

  2. 分析了并行关联规则挖掘算法存在的不足,提出了一种改进的关联规则挖掘的多核并行优化算法。该算法对Apriori算法的压缩矩阵进行了改造,并在多核平台下利用OpenMP技术和TBB技术对串行程序进行循环并行化和任务分配的并行化设计,最大限度地实现并行关联规则挖掘。
  3. 所属分类:其它

    • 发布日期:2020-10-23
    • 文件大小:409600
    • 提供者:weixin_38557768
  1. 嵌入式系统/ARM技术中的浅谈模糊C均值聚类算法的并行化研究

  2. 摘  要: 使用Intel Parallel Amplifier高性能工具,针对模糊C均值聚类算法在多核平台的性能问题,找出串行程序的热点和并发性,提出并行化设计方案。基于Intel并行库TBB(线程构建模块)和OpenMP运行时库函数,对多核平台下的串行程序进行循环并行化和任务分配的并行化设计。   并行性主要是指同时性或并发性,并行处理是指对一种相对于串行处理的处理方式,它着重开发计算过程中存在的并发事件。并行性通常划分为作业级、任务级、例行程序或子程序级、循环和迭代级以及语句和指令级。作业
  3. 所属分类:其它

    • 发布日期:2020-10-21
    • 文件大小:206848
    • 提供者:weixin_38747144
  1. 基于OpenMP的电磁场FDTD多核并行程序设计

  2. 摘要:本文探讨了基于OpenMP的电磁场FDTD多核并行程序设计的方法,以期实现该方法在更复杂的算法中应用具有更理想的性能提升。针对一个一维电磁场FDTD算法问题,对其计算方法与过程做了简单描述。   在Fortran语言环境中,采用OpenMP+细粒度并行的方式实现了并行化,即只对循环部分进行并行计算,并将该并行方法在一个三维瞬态场电偶极子辐射FDTD 程序中进行了验证。该并行算法取得了较其他并行FDTD 算法更快的加速比和更高的效率。结果表明基于OpenMP的电磁场FDTD并行算法具有非常
  3. 所属分类:其它

    • 发布日期:2020-10-20
    • 文件大小:177152
    • 提供者:weixin_38569203
  1. 模糊C均值聚类算法的并行化研究

  2. 使用Intel Parallel Amplifier高性能工具,针对模糊C均值聚类算法在多核平台的性能问题,找出串行程序的热点和并发性,提出并行化设计方案。基于Intel并行库TBB(线程构建模块)和OpenMP运行时库函数,对多核平台下的串行程序进行循环并行化和任务分配的并行化设计。
  3. 所属分类:其它

    • 发布日期:2020-10-23
    • 文件大小:225280
    • 提供者:weixin_38592848
  1. 工业电子中的图像采集压缩和高清分析并行处理的硬件系统设计

  2. 摘 要:将DSP与FPGA结合, 设计一种对CMOS图像传感器进行图像采集和处理的硬件系统。该系统能够在硬件层面把图像分路处理,一路直接压缩后传输,另一路循环存储到多帧高清图像存储区,便于软件分析,较好地解决了传输带宽不足与智能监控需要高分辨率图像进行分析处理的矛盾需求。该系统具有高清图像实时采集处理的优点和硬件平台通用性,可用不同硬件实现不同的图像分析处理。   0.引言   随着科学技术的发展和社会发展应用需求,人们对视频图像采集处理高清化,传输实时化和控制智能化的要求越来越高。高清视频
  3. 所属分类:其它

    • 发布日期:2020-11-05
    • 文件大小:187392
    • 提供者:weixin_38528517
  1. Simple-Sparsely-Connected-NN:稀疏连接的多层神经网络的简单C ++实现,使用OpenMP和CUDA进行并行化-源码

  2. 简单稀疏连接神经网络 稀疏连接的多层神经网络的简单C ++实现,使用OpenMP和CUDA进行并行化。 OpenMP的 该程序的该版本使用OpenMP来实现并行性。 编译并运行 脚步: cd OpenMP/src g++ -fopenmp main.cpp NeuralNet.cpp Vector.cpp -o openmp OMP_NUM_THREADS=p ./openmp [N] [K] [p_mode] [v_mode] 争论 N,指定输入层中节点(神经元)的数量,应为正整数 K,指
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:606208
    • 提供者:weixin_42131261
  1. xbps-cycles:空包装循环检测仪-源码

  2. 空包装循环检测仪 此脚本枚举软件包的依赖关系,并标识构建时的依赖周期。 它基于Void维护者Chocimier提供的。 关键区别是 没有创建中间文件 默认情况下,依赖项枚举是并行化的 输出提供了更详细的周期视图 对于命令语法,运行xbps-cycles.py -h 。 通常,不带参数运行xbps-cycles.py可能就足够了。 默认情况下,脚本将在$XBPS_DISTDIR处查找存储库; 如果未定义该变量,则使用当前目录。 要覆盖此行为,请使用-d选项提供所需的空包克隆的路径。 标准行为是产
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:4096
    • 提供者:weixin_42118770
  1. c#并行计算(大量循环处理的场景下)

  2. 沿用微软的写法,System.Threading.Tasks.::.Parallel类,提供对并行循环和区域的支持。我们会用到的方法有For,ForEach,Invoke。首先我们初始化一个List用于循环,这里我们循环10次。(后面的代码都会按这个标准进行循环)下面我们定义4个方法,分别为for,foreach,并行For,并行ForEach。并测试他们的运行时长。下面是运行结果:这里我们可以看出并行循环在执行效率上的优势了。结论1:在对一个数组内的每一个项做单独处理时,完全可以选择并行循环的
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:165888
    • 提供者:weixin_38704485
  1. OpenMP中的任务调度

  2. OpenMP中,任务调度主要用于并行的for循环中,当循环中每次迭代的计算量不相等时,如果简单地给各个线程分配相同次数的迭代的话,会造成各个线程计算负载不均衡,这会使得有些线程先执行完,有些后执行完,造成某些CPU核空闲,影响程序性能。例如以下代码: 如果将最外层循环并行化的话,比如使用4个线程,如果给每个线程平均分配25次循环迭代计算的话,显然i=0和i=99的计算量相差了100倍,那么各个线程间可能出现较大的负载不平衡情况。为了解决这些问题,OpenMP中提供了几种对for循环并行化的任务调
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:59392
    • 提供者:weixin_38528680
  1. c#并行计算(大量循环处理的场景下)

  2. 沿用微软的写法,System.Threading.Tasks.::.Parallel类,提供对并行循环和区域的支持。 我们会用到的方法有For,ForEach,Invoke。首先我们初始化一个List用于循环,这里我们循环10次。(后面的代码都会按这个标准进行循环)下面我们定义4个方法,分别为for,foreach,并行For,并行ForEach。并测试他们的运行时长。 下面是运行结果:这里我们可以看出并行循环在执
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:165888
    • 提供者:weixin_38736529
  1. 基于OpenMP的电磁场FDTD多核并行程序设计

  2. 摘要:本文探讨了基于OpenMP的电磁场FDTD多核并行程序设计的方法,以期实现该方法在更复杂的算法中应用具有更理想的性能提升。针对一个一维电磁场FDTD算法问题,对其计算方法与过程做了简单描述。   在Fortran语言环境中,采用OpenMP+细粒度并行的方式实现了并行化,即只对循环部分进行并行计算,并将该并行方法在一个三维瞬态场电偶极子辐射FDTD 程序中进行了验证。该并行算法取得了较其他并行FDTD 算法更快的加速比和更高的效率。结果表明基于OpenMP的电磁场FDTD并行算法具有非常
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:173056
    • 提供者:weixin_38586942
  1. 图像采集压缩和高清分析并行处理的硬件系统设计

  2. 摘 要:将DSP与FPGA结合, 设计一种对CMOS图像传感器进行图像采集和处理的硬件系统。该系统能够在硬件层面把图像分路处理,一路直接压缩后传输,另一路循环存储到多帧高清图像存储区,便于软件分析,较好地解决了传输带宽不足与智能监控需要高分辨率图像进行分析处理的矛盾需求。该系统具有高清图像实时采集处理的优点和硬件平台通用性,可用不同硬件实现不同的图像分析处理。   0.引言   随着科学技术的发展和社会发展应用需求,人们对视频图像采集处理高清化,传输实时化和控制智能化的要求越来越高。高清视频
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:246784
    • 提供者:weixin_38640072
  1. 浅谈模糊C均值聚类算法的并行化研究

  2. 摘  要: 使用Intel Parallel Amplifier高性能工具,针对模糊C均值聚类算法在多核平台的性能问题,找出串行程序的热点和并发性,提出并行化设计方案。基于Intel并行库TBB(线程构建模块)和OpenMP运行时库函数,对多核平台下的串行程序进行循环并行化和任务分配的并行化设计。   并行性主要是指同时性或并发性,并行处理是指对一种相对于串行处理的处理方式,它着重开发计算过程中存在的并发事件。并行性通常划分为作业级、任务级、例行程序或子程序级、循环和迭代级以及语句和指令级。作业
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:239616
    • 提供者:weixin_38621365
« 12 3 4 5 6 7 8 9 10 »