您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. CUDA并行计算的应用研究.pdf

  2. 统一设备架构(CUDA) 是NV ID IA公司提出的一个基于GPU通用计算的开发环境, 它 针对GPU多处理单元的特性, 通过并行计算提高大规模运算的速度。根据CUDA技术的特点, 提出了基于CUDA的并行图像锐化、中值滤波和字符搜索算法, 并论述其关键技术和基本执行 流程。试验结果表明, 提出的方法相对于CPU方法在运算速度上有不同程度的提高和下降。这 同时体现了CUDA的优势和局限性, 为其更复杂的应用提供了参考和依据。
  3. 所属分类:其它

    • 发布日期:2010-06-08
    • 文件大小:1048576
    • 提供者:huiyuanwujian
  1. 图形处理器架构(GPU_Architecture)与图形管线(Graphics_Pipeline)入门

  2. 图形处理器架构(GPU_Architecture)与图形管线(Graphics_Pipeline)入门
  3. 所属分类:其它

    • 发布日期:2010-11-12
    • 文件大小:4194304
    • 提供者:xiucaijiang
  1. Android图书集合

  2. Android應用框架原理與程式設計,Android开发教程笔记,Android开发指南中文版,Android编程指南 程序员入门(中文版),图形处理器架构(GPU_Architecture)与图形管线(Graphics_Pipeline)入门
  3. 所属分类:Android

    • 发布日期:2012-05-29
    • 文件大小:46137344
    • 提供者:wolf937
  1. 图形处理器架构(GPU_Architecture)与图形管线(Graphics_Pipeline)入门

  2. 一篇关于GPU架构和基本设计原则的论文,以Nvidia's "Geforce"系列的显卡为例,讲述一系列关于着色器,渲染管线,光栅化的知识
  3. 所属分类:其它

    • 发布日期:2016-08-13
    • 文件大小:4194304
    • 提供者:attacker_cwp
  1. 具有定点顶点着色器可编程的图形处理器的设计.pdf

  2. 实时3D图形成为移动终端最具吸引力的应用程序,其中电池寿命和小计算能力限制了图形处理的系统资源和内存带宽。此外,由于用户在非常接近的小屏幕上观看图形图像,最近的移动3D图形在硬件和软件中引入了可编程性,以实现更高级的功能,同时实现低功耗。在这项研究中,我设计并实现了可编程具有定点顶点着色器的图形处理器,适用于移动应用。所提出的架构具有四个主要特征:数据传输流的分离,带有流处理的全硬件加速,指令集架构的两级扩展,以及定点单指令多数据处理。
  3. 所属分类:其它

    • 发布日期:2019-07-23
    • 文件大小:2097152
    • 提供者:weixin_39841848
  1. 专用芯片技术中的千元机新宠!联发科Helio X12处理器详解

  2. 发布会上没有见到Helio X20的首秀让人不免失望,不过时值年尾,各家厂商都将更新处理器,海思麒麟950已经率先商用了Cortex-A72架构,高通骁龙820和Exynos8890也已经亮相。而联发科除了旗舰级处理器X20之外,中端新品Helio X12日前也被曝光,竞争对手直指高通骁龙620。    据了解,Helio X12(代号MT6795X)将采用台积电28nm HPC+工艺制程,相比于此前的28nm HPC而言降低功耗30%,减少面积10%。架构上,该处理器采用8核64位Cortex
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:151552
    • 提供者:weixin_38698539
  1. 移动图形处理器的纹理Cache设计

  2. 为了提高移动图形处理器中统一架构染色器的效率,减少其与片外存储器间的访问次数,提出了一种4端口纹理高速缓存结构。该结构采用基于Mipamp算法的纹理映射和基于细化层次(Level of Detail,LOD)选择不同单端口Cache的存储方式,提高了纹理Cache的命中率。此外为了提高数据吞吐率,采用4端口并行读取纹素。设计了FIFO缓冲区预取数据,降低访存延迟。利用SV搭建实验平台对纹理图像进行测试,结果表明纹理Cache的平均命中率为92.5%,数据吞吐率接近单端口Cache的4倍。
  3. 所属分类:其它

    • 发布日期:2020-10-15
    • 文件大小:522240
    • 提供者:weixin_38653443
  1. DSP中的GPU架构下的并行计算

  2. 摘要:为降低粒子群优化算法(PSO:Particle Swarm Optimization)时间和空间的复杂度随问题规模的增大而越来越高的问题,对图形处理器(GPU:Graphic Processing Unit)用于并行计算的方法进行了分析,利用GPU的并行特性,实现了粒子群优化算法路径搜索过程的并行化.测试函数实验结果证明,GPU平台较CPU模式下的计算,其搜索速率有明显提高.   O 引言   图形处理芯片(GPU:Graphic Processing Unit)技术日渐成熟,当前可编
  3. 所属分类:其它

    • 发布日期:2020-10-20
    • 文件大小:115712
    • 提供者:weixin_38722184
  1. 异构多核SoC可编程图形系统硬件设计

  2. 采用开源LEON3(basic version)处理器,运行Linux操作系统,并驱动西安邮电大学自主设计研发的基于传统GPU架构的可编程图形处理器,实现了包含可编程图形系统的SoC平台。将系统集成到Dini Group最新的DNV6_F2PCIE开发板上,采取OpenGL编程,通过鼠标、键盘、显示器运行2D、3D程序,进行图形的绘制,从而比较充分地验证了图形系统硬件设计。
  3. 所属分类:其它

    • 发布日期:2020-10-17
    • 文件大小:315392
    • 提供者:weixin_38653687
  1. 异构SoC图形器中可编程剪裁器的设计与实现

  2. 随着图形处理性能的不断提升,图形处理的运算量也日益增多,传统的嵌入式系统面临着挑战。解决这一问题的方案之一是运用可编程器件开发适用于嵌入式系统的图形处理器,从而提高处理速度。现代图形处理器采用各种可编程的着色处理器,虽然ASIC的速度和功耗性能优于可编程处理器,但其灵活性与可靠性却是无法与可编程处理器比拟的。采用一种带精简指令的微控制器架构,重点研究用汇编和可编程处理器协同实现平面剪裁功能,代替原来用纯硬件实现的功能,该流水线执行多指令多数据流(MIMD)。最后,使用大量的测试用例对点、线和三角
  3. 所属分类:其它

    • 发布日期:2020-10-17
    • 文件大小:484352
    • 提供者:weixin_38628926
  1. 多家中国领先芯片设计公司选择ARM:registered: Cortex:trade_mark:-A9处理器技术打造下一代家庭娱乐片上系统

  2. ARM公司(伦敦证交所:ARM;纳斯达克:ARMH)近日宣布,在过去一年多时间内,海思(Hisilicon)、晶晨半导体(Amlogic)、中天联科(Availink)、海尔(Haier)等多家中国知名芯片公司获得ARM处理器授权,用于其为机顶盒(STB)和数字电视(DTV)等数字家庭娱乐应用而设计的下一代片上系统(SoC)芯片。在这些公司中,有多家选择了ARM:registered: Cortex:trade_mark:-A9处理器和Mali:trade_mark:图形处理器。这一系列的授权协
  3. 所属分类:其它

    • 发布日期:2020-10-25
    • 文件大小:80896
    • 提供者:weixin_38691194
  1. 通信与网络中的NVIDIA推出nForce 780i SLI媒体和通信处理器

  2. 在每年一度的圣诞佳节即将到来之际,全球视觉计算技术的行业领袖NVIDIA公司近日宣布推出下一代NVIDIA nForce 780i SLI媒体和通信处理器(MCP)。   全新NVIDIA nForce 780i SLI MCP专为拥有1333 MHz前端总线的英特尔四核处理器QX9650(Yorkfield)而设计,为英特尔平台引入了诸多全新功能,其中包括全新超级玩家系统架构(ESA)规格和PCI Express 2.0支持。此外,它还是第一款支持NVIDIA全新三路SLI技术的主板解决方案。
  3. 所属分类:其它

    • 发布日期:2020-11-25
    • 文件大小:62464
    • 提供者:weixin_38699492
  1. 通信与网络中的NVIDIA推出下一代nForce 780i媒体和通信处理器

  2. NVIDIA公司宣布推出下一代NVIDIA nForce 780i SLI媒体和通信处理器(MCP)。全新NVIDIA nForce 780i SLI MCP专为拥有1333MHz前端总线的英特尔四核处理器QX9650(Yorkfield)而设计,为英特尔平台引入了诸多全新功能,其中包括全新超级玩家系统架构(ESA)规格和PCI Express 2.0支持。此外,它还是第一款支持NVIDIA全新三路SLI技术的主板解决方案。三路SLI技术是领先的基于NVIDIA GeForce图形处理器的多GP
  3. 所属分类:其它

    • 发布日期:2020-11-24
    • 文件大小:47104
    • 提供者:weixin_38718413
  1. 嵌入式系统/ARM技术中的应用处理器子系统使SoC设计更容易

  2. LSI Logic公司开发的低功耗处理器架构子系统瞄准GPS导航系统、电子玩具、个人媒体播放器以及许多其它低功耗手持应用。Zevio架构提供了一套完整的支持功能和总线互连,设计人员能够很容易地开发SoC解决方案。这种SoC包括一个或多个CPU或DSP内核、视频支持、2D或3D图形、64通道3D/2D音响引擎、USB端口和NAND闪存接口、 SDRAM,以及双数据速率(DDR)或DDR2 DRAM等IP预验证模块中的功能。IP预验证模块对于开发从ARM和ZSP DSP到视频编解码器、3D图形和2D
  3. 所属分类:其它

    • 发布日期:2020-12-02
    • 文件大小:88064
    • 提供者:weixin_38725902
  1. 集成电路行业报告:图形处理器芯片GPU

  2. 五雄争霸,手机厂商不甘寂寞。在移动 GPU 领域,主要以 Imagination、ARM、Qualcomm、 Vivante、NVIDIA 为主。高通目前是 Android 阵营最大的处理器供应商。移动端主要使 用集成 GPU,因此,高通 GPU 因其处理器的市场优势也有所受益。ARM Mail GPU 的主要 使用者是华为和三星。ARM Mail 的 GPU 性能相对较弱,因此华为在2018年通过推出 GPU Turbo 软硬件优化弥补短板。三星方面已经与 AMD 前敌多年的 IP 授权,AM
  3. 所属分类:其它

    • 发布日期:2021-03-22
    • 文件大小:1048576
    • 提供者:weixin_38710781
  1. 分析图形处理器单元(GPU)指令集架构

  2. 分析图形处理器单元(GPU)指令集架构
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:558080
    • 提供者:weixin_38562085
  1. 能源效率驱动的移动图形处理器的可编程和可自重配置架构

  2. 能源效率驱动的移动图形处理器的可编程和可自重配置架构
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:214016
    • 提供者:weixin_38565628
  1. 应用于嵌入式图形处理器的实时目标检测方法

  2. 提出了一种应用于嵌入式图形处理器(GPU)的实时目标检测算法。针对嵌入式平台计算单元较少、处理速度较慢的现状,提出了一种基于YOLO-V3(You Only Look Once-Version 3)架构的改进的轻量目标检测模型,对汽车目标进行了离线训练,在嵌入式平台上部署训练好的模型,实现了在线检测。实验结果表明,在嵌入式平台上,所提方法对分辨率为640 pixel×480 pixel的视频图像的检测速度大于23 frame/s。
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:9437184
    • 提供者:weixin_38740397
  1. 一种基于新型查表方法的统一计算设备架构并行计算全息算法

  2. 为解决点源法计算全息速度较慢的问题,提出了一种新的查表算法,命名为三角函数查表法(T-LUT算法)。该算法是基于点源法基本的数学公式,通过一系列数学近似与恒等变换,生成了一种纯相位查找表,该查找表具有三维特性,并具有生成速度快、精度高、占用内存少等特点,克服了点源法重复计算相位的缺点。同时采用统一计算设备架构(CUDA)并行计算在图形处理器(GPU)上加以实现,并进行了三次并行优化。在算法的验证与对比实验中,采用单显卡(GPU显卡)实现T-LUT算法,在不牺牲全息图再现像质量的前提下,成功地将点
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:3145728
    • 提供者:weixin_38743076
  1. 基于图形处理器的人体皮肤组织实时成像谱域相干光断层成像系统

  2. 光学相干层析(OCT)技术在活体成像应用中的无损、高速、超高分辨率特性使其在生物医学领域有着广阔的发展空间。通常情况下, OCT系统的数据采集量巨大, 图像重建中包含的快速傅里叶变换(FFT)需要大量的计算时间, 中央处理器(CPU)串行数据处理模式难以满足实时成像的需求。针对这一问题, 将统一计算设备架构(CUDA)并行编程技术应用到皮肤组织成像的谱域相干光断层成像(SD-OCT)系统数据处理过程中, 并在图形处理器(GPU)上予以实现。详述了系统算法并行化拆分以及对系统采集到的数据进行并行化
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:5242880
    • 提供者:weixin_38741075
« 12 3 4 5 6 7 8 9 10 ... 13 »