您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 利用高性能计算加速深度学习算法

  2. 介绍利用GPU加速深度学习算法,涉及模型并行和数据并行,主从模式和令牌环模式通信,满足GPU集群数据划分方法;最后介绍了利用FPGA加速线上识别算法,提高性能功耗比
  3. 所属分类:其它

    • 发布日期:2015-11-03
    • 文件大小:551936
    • 提供者:zhang0311
  1. FPGA-嵌入式-电路-板卡-设计开发-承接-承包-外包

  2. 我们提供完善的FPGA设计开发、嵌入式系统、板卡设计开发等相关解决方案。 1、提供基于Xilinx/Altera FPGA的高性能计算(HPC)硬件平台、FGPA加速卡,本硬件加速平台基于PCI Express总线,采用超高性能FPGA作为运算节点。在高性能计算(High Performance Computing)上表现出卓越的性能。尤其适合于大规模逻辑运算。具备高性能、低功耗、低成本、可编程的特性。 2、本平台为我司自主研发,可以根据用户实际需要进行修改定制:  定制算法与逻辑; 定制PC
  3. 所属分类:嵌入式

    • 发布日期:2017-08-30
    • 文件大小:226304
    • 提供者:aoshi_0303
  1. FPGA的CNN网络加速代码,重磅资源

  2. FPGA的CNN网络加速代码,重磅资源,亲侧可用的,讲述了使用HLS写入深度学习CNN的推断部分加速代码,网络通用性高。
  3. 所属分类:深度学习

    • 发布日期:2017-10-23
    • 文件大小:34603008
    • 提供者:supermanqc
  1. Deep Learning on FPGAs Past, Present, and Future

  2. 基于FPGA的深度学习加速综述,详细介绍了FPGA下,深度学习面临的问题及挑战
  3. 所属分类:深度学习

    • 发布日期:2018-05-10
    • 文件大小:449536
    • 提供者:duyankang
  1. CNN FPGA加速概述

  2. 来自MIT深度学习团队撰写的FPGA CNN加速技术简介,里面有很多干活哦!
  3. 所属分类:深度学习

    • 发布日期:2018-06-21
    • 文件大小:4194304
    • 提供者:weixin_39646286
  1. Toolflows for Mapping Convolutional Neural Networks on FPGAs_ A Survey

  2. 详细介绍了FPGA进行深度学习加速的方案,以及与各个平台的对比分析,分析了不同FPGA平台进行深度学习加速的性能对比。
  3. 所属分类:深度学习

    • 发布日期:2018-09-13
    • 文件大小:1048576
    • 提供者:shiyangcool
  1. 基于HLS的Tiny_yolo卷积神经网络加速研究

  2. 基于HLS的Tiny_yolo卷积神经网络加速研究,从论文的角度对基于FPGA的深度学习实现方法进行了说明
  3. 所属分类:深度学习

    • 发布日期:2018-09-13
    • 文件大小:2097152
    • 提供者:shiyangcool
  1. 深度学习FPGA加速器的进展与趋势_吴艳霞.pdf

  2. 随着大数据时代的来临,深度学习技术在从海量数据中提取有价值信息方面发挥着重要作用,已被广泛应用于计算机视觉、语音识别及自然语言处理等领域。本文从深度学习算法的特点和发展趋势出发,分析 FPGA 加速深度学习的优势以及技术挑战;其次,从 SoC FPGA 和标准 FPGA 两个方面介绍了 CPU-FPGA 平台,主要对比分析了两种模型在 CPU 和FPGA 之间数据交互上的区别;接下来,在介绍 FPGA 加速深度学习算法的开发环境基础上,重点从硬件结构、设计思路和优化策略这三个方面详细综述了采用
  3. 所属分类:深度学习

    • 发布日期:2019-08-15
    • 文件大小:1048576
    • 提供者:happysheep2008
  1. 基于FPGA的深度学习加速器

  2. 基于FPGA的深度学习加速器,基于FPGA的深度学习加速器,基于FPGA的深度学习加速器,基于FPGA的深度学习加速器,基于FPGA的深度学习加速器,基于FPGA的深度学习加速器。
  3. 所属分类:硬件开发

    • 发布日期:2020-01-10
    • 文件大小:4194304
    • 提供者:dengxf01
  1. A Framework for Generating High Throughput CNN Implementations on FPGAs.pdf

  2. 一种FPGA硬件加速方案,实现深度学习,可实现高吞吐量的CNN网络Session 3: Deep Learning FPGA 18, February 25-27, Monterey, CA, USA maps. Let b, n and m index into the Batch, fin and fout dimensions Table 1: Variation of model paramcters Equation 4 specifies the operations of a co
  3. 所属分类:深度学习

    • 发布日期:2019-07-20
    • 文件大小:2097152
    • 提供者:shiyangcool
  1. Synetgy_ Algorithm-hardware Co-design for ConvNet Accelerators on Embedded FPGAs

  2. 2019年FPGA会议 通过FPGA硬件加速实现深度学习,卷积神经网络
  3. 所属分类:深度学习

    • 发布日期:2019-07-20
    • 文件大小:947200
    • 提供者:shiyangcool
  1. 【详解】FPGA:机器深度学习的未来?

  2. 最近几年数据量和可访问性的迅速增长,使得人工智能的算法设计理念发生了转变。人工建立算法的做法被计算机从大量数据中自动习得可组合系统的能力所取代,使得计算机视觉、语音识别、自然语言处理等关键领域都出现了重大突破。深度学习是这些领域中所最常使用的技术,也被业界大为关注。然而,深度学习模型需要极为大量的数据和计算能力,只有更好的硬件加速条件,才能满足现有数据和模型规模继续扩大的需求。     现有的解决方案使用图形处理单元(GPU)集群作为通用计算图形处理单元(GPGPU),但现场可编程门阵列(FP
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:152576
    • 提供者:weixin_38629303
  1. Advanced-FPGA-Design:109-2 NTUT EE课程-源码

  2. 先进的FPGA设计 109-2 NTUT EE课程 描述 本课程教授FPGA编程,硬件系统设计以及如何在FPGA上实现和加速深度学习算法。大纲显示如下:1. Xilinx和Vivado IDE 2.高级综合(HLS)和SystemC 3.有限冲激响应(FIR)滤波器4.离散傅立叶变换和快速傅立叶变换5.矩阵乘法6.前缀和和直方图7.视频系统8.在FPGA上的深度学习实现9.修剪和量化10.在FPGA上的对象检测。 实验室
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:2097152
    • 提供者:weixin_42129970
  1. 深度学习的异构加速技术(二):螺狮壳里做道场

  2. 本文来自于www.qcloud.com,主要以当前学术界在AI处理器构架方面的讨论为主,其次对一些流式处理及数据复用,片上存储及其优化等方面接受本篇文章。在一文所述的AI加速平台的第一阶段中,无论在FPGA还是ASIC设计,无论针对CNN还是LSTM与MLP,无论应用在嵌入式终端还是云端(TPU1),其构架的核心都是解决带宽问题。不解决带宽问题,空有计算能力,利用率却提不上来。就像一个8核CPU,若其中一个内核就将内存带宽100%占用,导致其他7个核读不到计算所需的数据,将始终处于闲置状态。对此
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:731136
    • 提供者:weixin_38668335
  1. 深度学习的异构加速技术(二):螺狮壳里做道场

  2. 本文来自于www.qcloud.com,主要以当前学术界在AI处理器构架方面的讨论为主,其次对一些流式处理及数据复用,片上存储及其优化等方面接受本篇文章。在一文所述的AI加速平台的第一阶段中,无论在FPGA还是ASIC设计,无论针对CNN还是LSTM与MLP,无论应用在嵌入式终端还是云端(TPU1),其构架的核心都是解决带宽问题。不解决带宽问题,空有计算能力,利用率却提不上来。就像一个8核CPU,若其中一个内核就将内存带宽100%占用,导致其他7个核读不到计算所需的数据,将始终处于闲置状态。对此
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:731136
    • 提供者:weixin_38586186
  1. Altera与百度展开合作在云数据中心使用FPGA加速

  2. 2014年9月23号,北京--Altera公司(NASDAQ:ALTR)与百度(NASDAQ:BIDU)--中国的在线搜索引擎,在深度学习应用中使用FPGA和卷积神经网络(CNN)算法上展开合作,这将对开发更准确、更快的在线搜索功能起到关键作用。Altera将在2014年9月22号纽约举行的华尔街大会高性能计算(HPC)上演示与百度展开的合作工作。   Altera-百度展台(#215B展位)展示了使用FPGA加速CNN能够非常快速的实现图像分类。对于图像分类和识别任务等关键搜索功能,CNN被
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:100352
    • 提供者:weixin_38735790
  1. 【详解】FPGA:机器深度学习的未来?

  2. 近几年数据量和可访问性的迅速增长,使得人工智能的算法设计理念发生了转变。人工建立算法的做法被计算机从大量数据中自动习得可组合系统的能力所取代,使得计算机视觉、语音识别、自然语言处理等关键领域都出现了重大突破。深度学习是这些领域中所常使用的技术,也被业界大为关注。然而,深度学习模型需要极为大量的数据和计算能力,只有更好的硬件加速条件,才能满足现有数据和模型规模继续扩大的需求。     现有的解决方案使用图形处理单元(GPU)集群作为通用计算图形处理单元(GPGPU),但现场可编程门阵列(FPGA
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:154624
    • 提供者:weixin_38705699
  1. 给 AI 换个“大动力小心脏”之通用 CNN 加速设计

  2. 导语  基于FPGA的通用CNN加速设计,可以大大缩短FPGA开发周期,支持业务深度学习算法快速迭代;提供与GPU相媲美的计算性能,但拥有相较于GPU数量级的延时优势,为业务构建强劲的实时AI服务能力。  WHEN?深度学习异构计算现状  随着互联网用户的快速增长,数据体量的急剧膨胀,数据中心对计算的需求也在迅猛上涨。同时,人工智能、高性能数据分析和金融分析等计算密集型领域的兴起,对计算能力的需求已远远超出了传统CPU处理器的能力所及。     异构计算被认为是现阶段解决此计算沟壑的关键技术,目
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:264192
    • 提供者:weixin_38570296
  1. 浅谈神经网络在FPGA平台上的实现方案

  2. 近十年来,人工智能又到了一个快速发展的阶段。深度学习在其发展中起到了中流砥柱的作用,尽管拥有强大的模拟预测能力,深度学习还面临着超大计算量的问题。在硬件层面上,GPU,ASIC,FPGA都是解决庞大计算量的方案。本文将阐释深度学习和FPGA各自的结构特点以及为什么用FPGA加速深度学习是有效的,并且将介绍一种递归神经网络(RNN)在FPGA平台上的实现方案。  揭开深度学习的面纱  深度学习是机器学习的一个领域,都属于人工智能的范畴。深度学习主要研究的是人工神经网络的算法、理论、应用。自从200
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:156672
    • 提供者:weixin_38630463
  1. 一种递归神经网络在FPGA平台上的实现方案详解

  2. 近十年来,人工智能又到了一个快速发展的阶段。深度学习在其发展中起到了中流砥柱的作用,尽管拥有强大的模拟预测能力,深度学习还面临着超大计算量的问题。在硬件层面上,GPU,ASIC,FPGA都是解决庞大计算量的方案。本文将阐释深度学习和FPGA各自的结构特点以及为什么用FPGA加速深度学习是有效的,并且将介绍一种递归神经网络(RNN)在FPGA平台上的实现方案。   揭开深度学习的面纱   深度学习是机器学习的一个领域,都属于人工智能的范畴。深度学习主要研究的是人工神经网络的算法、理论、应用。自
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:323584
    • 提供者:weixin_38722329
« 12 »