Performace-optimizing-in-Diagonal-Matrix-Multiplic

文件名称: Performace-optimizing-in-Diagonal-Matrix-Multiplication:我们必须减少对角矩阵乘法的执行时间。我们可以使用许多概念，例如循环展开，循环嵌套优化等-源码

所属分类: 其它

开发工具:

文件大小: 1kb

下载次数: 0

上传时间: 2021-03-05

提供者: weixin_********

下载 (1kb)

不能下载？报告错误

详细说明：在对角矩阵乘法中执行优化我们必须减少对角矩阵乘法的执行时间。我们可以使用许多概念，例如循环展开，循环嵌套优化等。问题陈述输入：两个N * N矩阵。 N = 2 ^ {K}，其中K是自然数。输出：长度为2N-1的数组。样本输入/输出：我必须执行的三个主要活动：单线程DMM（CPU）：将DMM视为单线程，可以减少DMM的执行时间。在这部分中，我学到了很多概念，例如循环嵌套优化。多线程DMM（CPU）：使用C ++中的pthreads库在多线程中实现了以上部分。检查了矩阵大小的不同输入的执行情况，并计算了加速速度。 CUDA（GPU）中的DMM：在这一部分中，我已经使用cuda编程语言在GPU上实现了DMM。输出向量的每个元素都被视为一个线程。它们都在不同的GPU线程块上并行执行。

(系统自动生成,下载前可以参看下载内容)