您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. CUDA matrixmul

  2. 矩阵相乘的并行计算,运用CUDA C进行并行加速,对于大规模矩阵相乘有很高的加速比
  3. 所属分类:C/C++

    • 发布日期:2012-05-08
    • 文件大小:10240
    • 提供者:renwenlong123
  1. 第十五章_异构运算、GPU及框架选型.pdf

  2. 深度学习训练和推理的过程中,会涉及到大量的向量(vector),矩阵(matrix)和张量(tensor)操作,通常需要大量的浮点计算,包括高精度(在训练的时候)和低精度(在推理和部署的时候)。GPU, 作为一种通用可编程的加速器,最初设计是用来进行图形处理和渲染功能,但是从2007年开始,英伟达(NVIDIA)公司提出了第一个可编程通用计算平台(GPU),同时提出了CUDA框架,从此开启了GPU用于通用计算的新纪元。此后,不计其数的科研人员和开发者,对各种不同类型的算法用CUDA进行(部分)改
  3. 所属分类:深度学习

    • 发布日期:2020-07-27
    • 文件大小:753664
    • 提供者:hkd_ywg