您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 《GPU高性能编程CUDA实战》前3章(原书名CUDA by Example)

  2. UDA是一种专门为提高并行程序开发效率而设计的计算架构。在构建高性能应用程序时,CUDA架构能充分发挥GPU的强大计算功能。《GPU高性能编程CUDA实战》首先介绍了CUDA架构的应用背景,并给出了如何配置CUDA C的开发环境。然后通过矢量求和运算、矢量点积运算、光线跟踪、热传导模拟等示例详细介绍了CUDA C的基本语法和使用模式。通过学习本书,读者可以清楚了解CUDA C中每个功能的适用场合,并编写出高性能的CUDA软件。
  3. 所属分类:C

    • 发布日期:2011-02-15
    • 文件大小:1048576
    • 提供者:hzbooks
  1. 基于c语言CUDA矩阵乘法

  2. 该程序是基于C语言,利用CUDA实现的多核处理矩阵乘法,利用多核,可大大提高执行的速度。
  3. 所属分类:C/C++

    • 发布日期:2011-07-01
    • 文件大小:2097152
    • 提供者:moming000
  1. CUDA By Example[GPU高性能编程CUDA实战](英文版)

  2. 《GPU高性能编程CUDA实战》由CUDA软件平台小组的两位高级工程师撰写,向广大程序员介绍了如何使用这项新技术作者通过多个示例详细介绍了CUDA开发中的方方面面《GPU高性能编程CUDA实战》首先简要介绍了CUDA平台和架构,并快速介绍了CUDA C,随后详细介绍了CUDA每个功能中的关键技术与权衡因素一通过学习这些内容,你可以很清楚地了解CUDAC中每个功能的适用场合,并编写出高性能的CUDA软件。
  3. 所属分类:其它

    • 发布日期:2011-08-24
    • 文件大小:2097152
    • 提供者:qiufeng_zlf
  1. CUDA+by+Example

  2. 计算行业正在从只使用CPU的“中央处理”向CPU与GPU并用的“协同处理”发展。为打造这一全新的计算典范,NVIDIA®(英伟达™)发明了CUDA并行计算架构,该架构现已应用于GeForce®(精视™)、ION™(翼扬™)、Quadro以及Tesla GPU(图形处理器)上,对应用程序开发人员来说,这是一个巨大的市场。 在消费级市场上,几乎每一款重要的消费级视频应用程序都已经使用CUDA加速或很快将会利用CUDA来加速,其中不乏Elemental Technologies公司、
  3. 所属分类:C/C++

    • 发布日期:2011-12-27
    • 文件大小:4194304
    • 提供者:xxt030626
  1. NVIDIA - CUDA by Example - An Introduction to General-Purpose GPU Programming

  2. cuda是一种专门为提高并行程序开发效率而设计的计算架构。在构建高性能应用程序时,cuda架构能充分发挥gpu的强大计算功能。本书首先介绍了cuda架构的应用背景,并给出了如何配置cuda c的开发环境。然后通过矢量求和运算、矢量点积运算、光线跟踪、热传导模拟等示例详细介绍了cuda c的基本语法和使用模式。通过学习本书,读者可以清楚了解cuda c中每个功能的适用场合,并编写出高性能的cuda软件。   本书适合具备c或者c 知识的应用程序开发人员、数值计算库开发人员等,也可以作为学习并行计
  3. 所属分类:C

    • 发布日期:2011-12-27
    • 文件大小:4194304
    • 提供者:a394733890
  1. 73页 张舒——CUDA基本介绍

  2. CUDA基本介 CUDA的一些基本运行环境和发展等简介。存储及访问,CUDA对C的扩充
  3. 所属分类:C/C++

    • 发布日期:2012-11-20
    • 文件大小:1048576
    • 提供者:asczt
  1. CUDA by exampleGPU高性能编程

  2. 《GPU高性能编程CUDA实战》由CUDA软件平台小组的两位高级工程师撰写,向广大程序员介绍了如何使用这项新技术作者通过多个示例详细介绍了CUDA开发中的方方面面《GPU高性能编程CUDA实战》首先简要介绍了CUDA平台和架构,并快速介绍了CUDA C,随后详细介绍了CUDA每个功能中的关键技术与权衡因素一通过学习这些内容,你可以很清楚地了解CUDAC中每个功能的适用场合,并编写出高性能的CUDA软件。
  3. 所属分类:其它

    • 发布日期:2013-10-24
    • 文件大小:1048576
    • 提供者:liuzihe1979
  1. CUDA高性能计算并行编程

  2. 1. CUDA简介 GPU是图形处理单元(Graphic Processing Unit)的简称,最初主要用于图形渲染。自九十年代开始,GPU的发展产生了较大的变化,NVIDIA、AMD(ATI)等GPU生产商敏锐的观察到GPU天生的并行性,经过他们对硬件和软件的改进,GPU的可编程能力不断提高,GPU通用计算应运而生。由于GPU具有比CPU强大的计算能力,为科学计算的应用提供了新的选择。 最早的GPU的开发直接使用了图形学的API,将任务映射成纹理的渲染过程,使用汇编或者高级着色器语言Cg,
  3. 所属分类:C

    • 发布日期:2014-04-11
    • 文件大小:433152
    • 提供者:u011481395
  1. CUDA面向大众的超级计算

  2. 当开发在GPU上运行的软件时,CUDA让你能够用熟悉的编程习惯来开发。 在使用象C这样的高级语言进行编程时,你是否考虑过从标准的多核处理器中获取几个数量级的巨大 的性能提升?你是否乐意于从其它设备中也这样做呢? ---------哪就来学习CUDA并行编程技术吧。
  3. 所属分类:C++

    • 发布日期:2014-05-22
    • 文件大小:33554432
    • 提供者:bygzg
  1. GPU高性能编程CUDA实战中文版

  2. cuda是一种专门为提高并行程序开发效率而设计的计算架构。在构建高性能应用程序时,cuda架构能充分发挥gpu的强大计算功能。本书首先介绍了cuda架构的应用背景,并给出了如何配置cuda c的开发环境。然后通过矢量求和运算、矢量点积运算、光线跟踪、热传导模拟等示例详细介绍了cuda c的基本语法和使用模式。通过学习本书,读者可以清楚了解cuda c中每个功能的适用场合,并编写出高性能的cuda软件。 译者序 序 前言 致谢 作者简介 第1章 为什么需要CUDA 1.1 本章目标 1.2 并行
  3. 所属分类:C

    • 发布日期:2015-11-19
    • 文件大小:30408704
    • 提供者:tianyongxiao
  1. Deep Belief Nets in C++ and CUDA C Volume 1 Restricted Boltzmann 无水印原版pdf

  2. Deep Belief Nets in C++ and CUDA C Volume 1 Restricted Boltzmann Machines and Supervised Feedforward Networks 英文无水印原版pdf pdf所有页面使用FoxitReader、PDF-XChangeViewer、SumatraPDF和Firefox测试都可以打开 本资源转载自网络,如有侵权,请联系上传者或csdn删除 查看此书详细信息请在美国亚马逊官网搜索此书
  3. 所属分类:C++

    • 发布日期:2018-04-25
    • 文件大小:3145728
    • 提供者:u011433684
  1. Deep Belief Nets in C++ and CUDA C Volume 2 Autoencoding in the Complex 无水印原版pdf

  2. Deep Belief Nets in C++ and CUDA C Volume 2 Autoencoding in the Complex Domain 英文无水印原版pdf pdf所有页面使用FoxitReader、PDF-XChangeViewer、SumatraPDF和Firefox测试都可以打开 本资源转载自网络,如有侵权,请联系上传者或csdn删除 查看此书详细信息请在美国亚马逊官网搜索此书
  3. 所属分类:C++

    • 发布日期:2018-06-02
    • 文件大小:5242880
    • 提供者:u011433684
  1. C语言行优先和列优先的问题深入分析

  2. C语言行优先和列优先的问题深入分析 摘要 本文主要探讨的是“行优先”原则和“列优先”原则的问题。 1. 背景 首先了解“行优先”和“列优先”的知识,这两种方式在数学上的直观描述如下,给定如下矩阵: 根据行优先的原则,其排序方式为 根据列优先的原则,其排序方式为 2. 计算机领域的应用 行列优先原则在计算机领域的应用主要如下。行优先或者列优先没有好坏,但其直接涉及到对内存中数据的最佳存储访问方式。因为在内存使用上,程序访问的内存地址之间连续性越好,程序的访问效率就越高;相应地,程序访问的
  3. 所属分类:其它

    • 发布日期:2020-12-31
    • 文件大小:71680
    • 提供者:weixin_38629303
  1. torchlib-opencv-gpu:安装CUDA工具包,cuDNN,Torchlib C ++,cmake,VS代码和OpenCV以进行机器学习-源码

  2. 安装Ubuntu18.04,CUDA工具包10.1,cuDNN,Torchlib C ++,cmake,VS代码和OpenCV以进行机器学习。 安装CUDA工具包和cuDNN 修改〜/ .Profile文件,扩展路径为10.1和10.2 启动终端Ctrl-Alt-T $ sudo apt-get update $ sudo vim ~/.profile 编辑文件并更改有关如何使用vim编辑器的简便指南: : # set PATH for cuda 10.1 installation
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:789504
    • 提供者:weixin_42128676
  1. occa:针对多种架构的JIT编译:C ++,OpenMP,CUDA,HIP,OpenCL,金属-源码

  2. 目录 什么是OCCA? 简而言之,OCCA(例如oca -rina)是一个开源库,旨在 易于编程不同类型的设备(例如CPU , GPU , FPGA ) 提供用于与后端设备API交互的 (例如, OpenMP , CUDA , HIP , OpenCL , Metal ) JIT编译后端内核并提供(对C的次要扩展)来为每个后端进行抽象编程 添加两个向量的“ Hello World”示例如下所示: kernel void addVectors ( const int entries,
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:1048576
    • 提供者:weixin_42129113
  1. 2D_3D_PolarFourierTransform:论文“用于极坐标和球面网格的离散傅立叶变换的精确快速计算”的C ++,CUDA和MATLAB代码-源码

  2. 2D_3D_PolarFourierTransform:论文“用于极坐标和球面网格的离散傅立叶变换的精确快速计算”的C ++,CUDA和MATLAB代码
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:42991616
    • 提供者:weixin_42131705
  1. Arraymancer:Nim中快速,符合人体工程学的便携式张量库,通过OpenMP,Cuda和OpenCL后端深入研究CPU,GPU和嵌入式设备-源码

  2. Arraymancer-一个n维张量(ndarray)库。 Arraymancer是Nim中的张量(N维数组)项目。 主要重点是提供一个快速且符合人体工学的CPU,Cuda和OpenCL ndarray库,可在其上构建科学的计算生态系统。 该库的灵感来自于Numpy和PyTorch,并针对以下用例: 用于数值计算的N维数组(张量) 机器学习算法(如Scikit-learn:最小二乘解算器,PCA和降维,分类器,回归器和聚类算法,交叉验证)。 深度学习 可以在没有机器学习和深度学习组件的
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:1048576
    • 提供者:weixin_42153793
  1. CPP编程:各种CC ++示例。 DirectX,OpenGL,CUDA,Vulkan,OpenCL-源码

  2. 各种C / C ++示例。 DirectX,OpenGL,CUDA,Vulkan,OpenCL。
  3. 所属分类:其它

    • 发布日期:2021-01-29
    • 文件大小:13631488
    • 提供者:weixin_42116672
  1. tensorflow-cmake:C,C ++,Go和Python中的TensorFlow示例,没有bazel,但带有cmake和FindTensorFlow.cmake-源码

  2. TensorFlow CMake / C ++集合 查看官方文档:您看到了什么? 普通票价? 现在,猜测一下:这是一个没有bazel的区域。 我们在这里使用CMake! 该集合包含可靠且简单的示例,可在C,C ++,Go和Python中使用TensorFlow:加载预训练的模型或编译带有或不带有CUDA的自定义操作。 所有构建均已针对最新的稳定TensorFlow版本进行了测试,并依赖于带有自定义CMake。 该cmake文件包含特定TF版本中的错误的常见解决方法。 TensorFlow
  3. 所属分类:其它

    • 发布日期:2021-01-28
    • 文件大小:669696
    • 提供者:weixin_42127748
  1. 用于性能分析和日志记录的模块化c++工具包。C, c++, CUDA, Fortran和Python的分析API和工具。c++模板API本质上是一个创建工具的框架:它旨在提供一个统一的接口,用于记录各种性能度量以及数据日志记录和与其他工具的

  2. timemory Timing + Memory + Hardware Counter Utilities for C / C++ / CUDA / Python GitHub git clone https://github.com/NERSC/timemory.git PyPi pip install timemory Spack spack install timemory Purpose The goal of timemory is to create an open-source p
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:2097152
    • 提供者:weixin_38558655
« 12 3 4 5 6 7 8 9 10 ... 18 »