NVIDIA® cuDNN is a GPU-accelerated library of primitives for deep neural networks. cuDNN是一个对DNN的GPU加速库。他提供高度可调整的在DNN中的常用的例程实现。 It provides highly tuned implementations of routines arising frequently in DNN applications: 常用语前向后向卷积网络,包括交叉相关。Convolutio
cuda9.0里面的cublas文档,对于cuda开发从业人士非常必要基础的一本小册子,不可错过Chapter 1
INTRODUCTION
The cuBlaS library is an implementation of BLAS(Basic Linear Algebra Subprograms
on top of the NvIDIACUDA runtime It allows the user to access the computational
resources of NVIDI
Batched Sparse Matrix Multiplication for Accelerating Graph Convolutional Networks
对图卷积网络进行加速的批量稀疏矩阵乘法
作者的ppt的pdf版本Formulation of Graph Convolution
GraphConvolution( A, X w, bias)
Feature
forb← o to batchsize
do for ch←0 to channel
y:=2a a,w
Y=AXW
do
高光谱图像分类是遥感领域的研究热点之一,是对地观测的重要手段,在地物的精细识别等领域具有重要的应用。使用卷积神经网络(CNN)可以有效地从原始图像中提取高级特征,具有较高的分类精度。但CNN计算量巨大,对硬件要求较高。为了提高模型计算效率,可以在图形处理器(GPU)上进行CNN模型的训练。现有的并行算法,比如GCN(GPU based Cube-CNN),无法充分利用GPU的并行能力,算法加速效果并不理想。为了进一步提升算法效率,提出基于通用矩阵乘法(GEMM)算法的GGCN(GPU based