您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. cutlass:线性代数子例程的CUDA模板-源码

  2. 刀尖2.4 CUTLASS 2.4-2020年11月 CUTLASS是CUDA C ++模板抽象的集合,用于在CUDA中的所有级别和规模上实现高性能矩阵乘法(GEMM)。 它包含类似于用于实现cuBLAS的分层分解和数据移动策略。 CUTLASS将这些“活动部件”分解为C ++模板类抽象的可重用的模块化软件组件。 可以通过自定义切片大小,数据类型和其他算法策略来对这些线程范围,warp范围,block范围和设备范围的原语进行专门化和调整。 所产生的灵活性简化了它们在自定义内核和应用程序中作为构
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:15728640
    • 提供者:weixin_42150341