搜索资源 - GEMM - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - GEMM

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

blas库函数
blas库函数基本介绍，包括一、二、三级，尤其是GEMM、GEMV
所属分类：Informix
- 发布日期：2013-08-08
- 文件大小：97280
- 提供者：llqqll11

GEMM算法优化库
GEMM算法优化库，支持自调优，能够运行在Linux和Windows平台，可以获得很高的矩阵乘加速性能。
所属分类：C++
- 发布日期：2014-11-11
- 文件大小：105472
- 提供者：huizhanyi

cudnn-8.0-windows10-x64-v6.0
NVIDIA® cuDNN is a GPU-accelerated library of primitives for deep neural networks. cuDNN是一个对DNN的GPU加速库。他提供高度可调整的在DNN中的常用的例程实现。 It provides highly tuned implementations of routines arising frequently in DNN applications: 常用语前向后向卷积网络，包括交叉相关。Convolutio
所属分类：其它
- 发布日期：2017-10-30
- 文件大小：105906176
- 提供者：ziqjay

Python-openaigemm开放单精度半精度GEMM通用矩阵乘法实现
openai-gemm：开放单精度/半精度GEMM(通用矩阵乘法)实现
所属分类：其它
- 发布日期：2019-08-11
- 文件大小：777216
- 提供者：weixin_39840914

cpp-用C和CUDA实现CNN
卷积神经网络的各种版本实现（CPU，CUDA_NAIVE，CUDA_TILED，GEMM）
所属分类：其它
- 发布日期：2019-08-16
- 文件大小：12582912
- 提供者：weixin_39840387

cpp-CUTLASSCUDAC高性能线性代数运算库
CUTLASS是CUDA C 模板抽象的集合，用于在CUDA中实现各个级别和规模的高性能矩阵乘法（GEMM）。
所属分类：其它
- 发布日期：2019-08-16
- 文件大小：6291456
- 提供者：weixin_39840387

cuda_9.0.176.2补丁就是他.zip
解决InternalError (see above for traceback): Blas GEMM launch failed问题，
所属分类：深度学习
- 发布日期：2019-10-20
- 文件大小：54525952
- 提供者：qq_43061705

CUBLAS_Library.pdf
cuda9.0里面的cublas文档，对于cuda开发从业人士非常必要基础的一本小册子，不可错过Chapter 1 INTRODUCTION The cuBlaS library is an implementation of BLAS(Basic Linear Algebra Subprograms on top of the NvIDIACUDA runtime It allows the user to access the computational resources of NVIDI
所属分类：深度学习
- 发布日期：2019-10-08
- 文件大小：2097152
- 提供者：baiyu33

Batched Sparse Matrix Multiplication for Accelerating Graph Convolutional PPT
Batched Sparse Matrix Multiplication for Accelerating Graph Convolutional Networks 对图卷积网络进行加速的批量稀疏矩阵乘法作者的ppt的pdf版本Formulation of Graph Convolution GraphConvolution( A, X w, bias) Feature forb← o to batchsize do for ch←0 to channel y:=2a a,w Y=AXW do
所属分类：深度学习
- 发布日期：2019-08-03
- 文件大小：2097152
- 提供者：yyl424525

智能合约12个案例
智能合约12个案例分享。通过对智能合约在12个案例的实践，总结出智能合约的应用之道。Table of contents Foreword by Nick Szabo Acknowledgments 347 Overview Smart Contract Use cases 14 Digital Identity 57 ecords Securities 9 Trade finance Derivatives 23 Financial Data recording 25 Mortgages 27
所属分类：Dapp
- 发布日期：2019-01-12
- 文件大小：5242880
- 提供者：weixin_44368777

机器学习的框架偏向于Python的13个原因
13个机器学习的框架偏向于Python的原因，供大家参考，具体内容如下前言主要有以下原因: 1. Python是解释语言，程序写起来非常方便写程序方便对做机器学习的人很重要。因为经常需要对模型进行各种各样的修改，这在编译语言里很可能是牵一发而动全身的事情，Python里通常可以用很少的时间实现。举例来说，在C等编译语言里写一个矩阵乘法，需要自己分配操作数（矩阵）的内存、分配结果的内存、手动对BLAS接口调用gemm、最后如果没用smart pointer还得手动回收内存空间。Pyt
所属分类：其它
- 发布日期：2020-12-23
- 文件大小：124928
- 提供者：weixin_38608055

TropicalGEMM.jl:快速热带矩阵乘法-源码
热带GEMM 仍在努力中！看到这里的讨论开始吧打开Julia REPL并键入]进入pkg>模式，然后使用以下命令安装相关软件包 pkg > add TropicalNumbers, Octavian, TropicalGEMM, BenchmarkTools 在julia REPL中，您可以尝试一个最低限度的工作示例 julia > using TropicalNumbers, Octavian, TropicalGEMM, BenchmarkTools julia &g
所属分类：其它
- 发布日期：2021-03-19
- 文件大小：7168
- 提供者：weixin_42128315

DD2358:KTH DD2358-源码
DD2358 KTH DD2358 Python模块CMakeLists.txt配置不正确，因此使用了指定的路径。要构建所有内容：＃1）创建构建目录并进行构建：光盘到lab2 mkdir构建光盘制作cmake .. 制作现在您应该拥有一个带有libmatrix.so的lib-folder和一个带有c-test程序的bin-folder。build目录中还有基于Fortran的程序gemm_test.out。＃2）构建python模块cd到lab2 / p / mkdir构建光盘制
所属分类：其它
- 发布日期：2021-03-10
- 文件大小：872448
- 提供者：weixin_42175035

拉伸：为GEMM和张量收缩扩展GPU性能-源码
用于为GEMM，类似于GEMM的问题（例如批处理的GEMM），N维张量收缩以及将GPU上的两个多维对象相乘的其他事物创建基准驱动的后端库的工具。有关文档，请参见。
所属分类：其它
- 发布日期：2021-02-23
- 文件大小：12582912
- 提供者：weixin_42137723

spmv：稀疏矩阵向量（SpMV）工作台-源码
病毒稀疏矩阵向量（SpMV）工作台。 x是一个密集数组 y是一个密集数组 A是一个稀疏矩阵。 y = Ax ./spmva-M x024 - 1024 -r 0.05 M 1024, K 1024, rho 0.050, T gemm 0.026158, MFLOP/s 76.46, T spmv 0.000018 + 0.013132, NNZ A 52465, NNZ B 44, err = 0.000000, rho_a 0.050035, rho_b 0.042969 MacBo
所属分类：其它
- 发布日期：2021-02-20
- 文件大小：9216
- 提供者：weixin_42100971

cublas_benchmarks：一些测试gemm和gemv性能的基准-源码
cublas_benchmarks：一些测试gemm和gemv性能的基准
所属分类：其它
- 发布日期：2021-02-17
- 文件大小：13312
- 提供者：weixin_42157166

宝石炉-源码
间断Galerkin方法的GPU-GEMM生成器安装对于用户 pip install gemmforge 对于开发人员 git clone https://github.com/ravil-mobile/gemmforge.git gemmforge cd gemmforge pip install -e . 用法 from gemmforge import DenseMatrix , GemmGenerator , GenerationError from gemmforge import
所属分类：其它
- 发布日期：2021-02-11
- 文件大小：67584
- 提供者：weixin_42125867

cutlass：线性代数子例程的CUDA模板-源码
刀尖2.4 CUTLASS 2.4-2020年11月 CUTLASS是CUDA C ++模板抽象的集合，用于在CUDA中的所有级别和规模上实现高性能矩阵乘法（GEMM）。它包含类似于用于实现cuBLAS的分层分解和数据移动策略。 CUTLASS将这些“活动部件”分解为C ++模板类抽象的可重用的模块化软件组件。可以通过自定义切片大小，数据类型和其他算法策略来对这些线程范围，warp范围，block范围和设备范围的原语进行专门化和调整。所产生的灵活性简化了它们在自定义内核和应用程序中作为构
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：15728640
- 提供者：weixin_42150341

GGCN:基于GPU的高光谱图像分类算法
高光谱图像分类是遥感领域的研究热点之一,是对地观测的重要手段,在地物的精细识别等领域具有重要的应用。使用卷积神经网络(CNN)可以有效地从原始图像中提取高级特征,具有较高的分类精度。但CNN计算量巨大,对硬件要求较高。为了提高模型计算效率,可以在图形处理器(GPU)上进行CNN模型的训练。现有的并行算法,比如GCN(GPU based Cube-CNN),无法充分利用GPU的并行能力,算法加速效果并不理想。为了进一步提升算法效率,提出基于通用矩阵乘法(GEMM)算法的GGCN(GPU based
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：3145728
- 提供者：weixin_38727980