您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. blas库函数

  2. blas库函数基本介绍,包括一、二、三级,尤其是GEMM、GEMV
  3. 所属分类:Informix

    • 发布日期:2013-08-08
    • 文件大小:97280
    • 提供者:llqqll11
  1. GEMM算法优化库

  2. GEMM算法优化库,支持自调优,能够运行在Linux和Windows平台,可以获得很高的矩阵乘加速性能。
  3. 所属分类:C++

    • 发布日期:2014-11-11
    • 文件大小:105472
    • 提供者:huizhanyi
  1. cudnn-8.0-windows10-x64-v6.0

  2. NVIDIA® cuDNN is a GPU-accelerated library of primitives for deep neural networks. cuDNN是一个对DNN的GPU加速库。他提供高度可调整的在DNN中的常用的例程实现。 It provides highly tuned implementations of routines arising frequently in DNN applications: 常用语前向后向卷积网络,包括交叉相关。Convolutio
  3. 所属分类:其它

    • 发布日期:2017-10-30
    • 文件大小:105906176
    • 提供者:ziqjay
  1. Python-openaigemm开放单精度半精度GEMM通用矩阵乘法实现

  2. openai-gemm:开放单精度/半精度GEMM(通用矩阵乘法)实现
  3. 所属分类:其它

    • 发布日期:2019-08-11
    • 文件大小:777216
    • 提供者:weixin_39840914
  1. cpp-用C和CUDA实现CNN

  2. 卷积神经网络的各种版本实现(CPU,CUDA_NAIVE,CUDA_TILED,GEMM)
  3. 所属分类:其它

    • 发布日期:2019-08-16
    • 文件大小:12582912
    • 提供者:weixin_39840387
  1. cpp-CUTLASSCUDAC高性能线性代数运算库

  2. CUTLASS是CUDA C 模板抽象的集合,用于在CUDA中实现各个级别和规模的高性能矩阵乘法(GEMM)。
  3. 所属分类:其它

    • 发布日期:2019-08-16
    • 文件大小:6291456
    • 提供者:weixin_39840387
  1. cuda_9.0.176.2补丁就是他.zip

  2. 解决InternalError (see above for traceback): Blas GEMM launch failed问题,
  3. 所属分类:深度学习

    • 发布日期:2019-10-20
    • 文件大小:54525952
    • 提供者:qq_43061705
  1. CUBLAS_Library.pdf

  2. cuda9.0里面的cublas文档,对于cuda开发从业人士非常必要基础的一本小册子,不可错过Chapter 1 INTRODUCTION The cuBlaS library is an implementation of BLAS(Basic Linear Algebra Subprograms on top of the NvIDIACUDA runtime It allows the user to access the computational resources of NVIDI
  3. 所属分类:深度学习

    • 发布日期:2019-10-08
    • 文件大小:2097152
    • 提供者:baiyu33
  1. Batched Sparse Matrix Multiplication for Accelerating Graph Convolutional PPT

  2. Batched Sparse Matrix Multiplication for Accelerating Graph Convolutional Networks 对图卷积网络进行加速的批量稀疏矩阵乘法 作者的ppt的pdf版本Formulation of Graph Convolution GraphConvolution( A, X w, bias) Feature forb← o to batchsize do for ch←0 to channel y:=2a a,w Y=AXW do
  3. 所属分类:深度学习

    • 发布日期:2019-08-03
    • 文件大小:2097152
    • 提供者:yyl424525
  1. 智能合约12个案例

  2. 智能合约12个案例分享。通过对智能合约在12个案例的实践,总结出智能合约的应用之道。Table of contents Foreword by Nick Szabo Acknowledgments 347 Overview Smart Contract Use cases 14 Digital Identity 57 ecords Securities 9 Trade finance Derivatives 23 Financial Data recording 25 Mortgages 27
  3. 所属分类:Dapp

    • 发布日期:2019-01-12
    • 文件大小:5242880
    • 提供者:weixin_44368777
  1. 机器学习的框架偏向于Python的13个原因

  2. 13个机器学习的框架偏向于Python的原因,供大家参考,具体内容如下 前言 主要有以下原因: 1. Python是解释语言,程序写起来非常方便 写程序方便对做机器学习的人很重要。 因为经常需要对模型进行各种各样的修改,这在编译语言里很可能是牵一发而动全身的事情,Python里通常可以用很少的时间实现。 举例来说,在C等编译语言里写一个矩阵乘法,需要自己分配操作数(矩阵)的内存、分配结果的内存、手动对BLAS接口调用gemm、最后如果没用smart pointer还得手动回收内存空间。Pyt
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:124928
    • 提供者:weixin_38608055
  1. TropicalGEMM.jl:快速热带矩阵乘法-源码

  2. 热带GEMM 仍在努力中! 看到这里的讨论 开始吧 打开Julia REPL并键入]进入pkg>模式,然后使用以下命令安装相关软件包 pkg > add TropicalNumbers, Octavian, TropicalGEMM, BenchmarkTools 在julia REPL中,您可以尝试一个最低限度的工作示例 julia > using TropicalNumbers, Octavian, TropicalGEMM, BenchmarkTools julia &g
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:7168
    • 提供者:weixin_42128315
  1. DD2358:KTH DD2358-源码

  2. DD2358 KTH DD2358 Python模块CMakeLists.txt配置不正确,因此使用了指定的路径。 要构建所有内容:#1)创建构建目录并进行构建: 光盘到lab2 mkdir构建光盘制作cmake .. 制作 现在您应该拥有一个带有libmatrix.so的lib-folder和一个带有c-test程序的bin-folder。build目录中还有基于Fortran的程序gemm_test.out。 #2)构建python模块cd到lab2 / p / mkdir构建光盘制
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:872448
    • 提供者:weixin_42175035
  1. 拉伸:为GEMM和张量收缩扩展GPU性能-源码

  2. 用于为GEMM,类似于GEMM的问题(例如批处理的GEMM),N维张量收缩以及将GPU上的两个多维对象相乘的其他事物创建基准驱动的后端库的工具。 有关文档,请参见 。
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:12582912
    • 提供者:weixin_42137723
  1. spmv:稀疏矩阵向量(SpMV)工作台-源码

  2. 病毒 稀疏矩阵向量(SpMV)工作台。 x是一个密集数组 y是一个密集数组 A是一个稀疏矩阵。 y = Ax ./spmva-M x024 - 1024 -r 0.05 M 1024, K 1024, rho 0.050, T gemm 0.026158, MFLOP/s 76.46, T spmv 0.000018 + 0.013132, NNZ A 52465, NNZ B 44, err = 0.000000, rho_a 0.050035, rho_b 0.042969 MacBo
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:9216
    • 提供者:weixin_42100971
  1. cublas_benchmarks:一些测试gemm和gemv性能的基准-源码

  2. cublas_benchmarks:一些测试gemm和gemv性能的基准
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:13312
    • 提供者:weixin_42157166
  1. 宝石炉-源码

  2. 间断Galerkin方法的GPU-GEMM生成器 安装 对于用户 pip install gemmforge 对于开发人员 git clone https://github.com/ravil-mobile/gemmforge.git gemmforge cd gemmforge pip install -e . 用法 from gemmforge import DenseMatrix , GemmGenerator , GenerationError from gemmforge import
  3. 所属分类:其它

    • 发布日期:2021-02-11
    • 文件大小:67584
    • 提供者:weixin_42125867
  1. cutlass:线性代数子例程的CUDA模板-源码

  2. 刀尖2.4 CUTLASS 2.4-2020年11月 CUTLASS是CUDA C ++模板抽象的集合,用于在CUDA中的所有级别和规模上实现高性能矩阵乘法(GEMM)。 它包含类似于用于实现cuBLAS的分层分解和数据移动策略。 CUTLASS将这些“活动部件”分解为C ++模板类抽象的可重用的模块化软件组件。 可以通过自定义切片大小,数据类型和其他算法策略来对这些线程范围,warp范围,block范围和设备范围的原语进行专门化和调整。 所产生的灵活性简化了它们在自定义内核和应用程序中作为构
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:15728640
    • 提供者:weixin_42150341
  1. GGCN:基于GPU的高光谱图像分类算法

  2. 高光谱图像分类是遥感领域的研究热点之一,是对地观测的重要手段,在地物的精细识别等领域具有重要的应用。使用卷积神经网络(CNN)可以有效地从原始图像中提取高级特征,具有较高的分类精度。但CNN计算量巨大,对硬件要求较高。为了提高模型计算效率,可以在图形处理器(GPU)上进行CNN模型的训练。现有的并行算法,比如GCN(GPU based Cube-CNN),无法充分利用GPU的并行能力,算法加速效果并不理想。为了进一步提升算法效率,提出基于通用矩阵乘法(GEMM)算法的GGCN(GPU based
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:3145728
    • 提供者:weixin_38727980