您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Intel® 64 and IA-32 Architectures Optimization Reference Manual(intel优化手册)

  2. Intel® 64 and IA-32 Architectures Optimization Reference Manual.pdf intel官方的优化手册,从体系结构优化,缓存优化,多核多线程优化,SIMD优化,SSE优化,电源优化等各个方面讲述优化手段。 权威的文档,助你更进一步优化。
  3. 所属分类:专业指导

    • 发布日期:2009-06-17
    • 文件大小:3145728
    • 提供者:mybandari
  1. JPEG2000软硬件优化技术的研究

  2. 一篇论文 JPEG2000软硬件优化技术的研究
  3. 所属分类:专业指导

    • 发布日期:2010-05-21
    • 文件大小:2097152
    • 提供者:superstar1103
  1. SSE指令集SSE优化手册

  2. SSE指令集SSE优化手册,SSE指令 SIMD优化
  3. 所属分类:专业指导

    • 发布日期:2010-12-18
    • 文件大小:87040
    • 提供者:chenmoo0821
  1. Intel 64及IA-32 架构优化参考手册

  2. Intel? 64 and IA-32 Architectures Optimization Reference Manual Intel系列CPU汇编程序的最权威参考资料——Intel公司制作,2006年11月更新。 本书介绍了如何优化软件以提高当前Intel 64及IA-32 架构处理器的运行性能,涉及NetBurst和Core微架构以及Hyper-Threading技术;主要面向软件程序员以及编译器编写者。内容包括: Intel 64及IA-32 处理器架构 通用优化向导 SIMD架构的
  3. 所属分类:硬件开发

    • 发布日期:2011-05-18
    • 文件大小:3145728
    • 提供者:tskylee
  1. GCC中SIMD指令的应用方法

  2. X86架构上的多媒体应用开发,如果能够使用SIMD指令进行优化, 性能将大大提高。 目前,IA-32的SIMD指令包括MMX,SSE,SSE2等几级。在GCC的开发环境中,有几种使 用SIMD指令的方式,本文逐一介绍。
  3. 所属分类:其它

    • 发布日期:2011-06-19
    • 文件大小:214016
    • 提供者:xunxun1982
  1. 白皮书:Stellaris® LM4F 系列微控制器(zslcn周生烈编译摘注)

  2. Stellaris®微控制器(MCU)是市场上基于ARM® Cortex™- M内核的第一个MCU;这种架构已迅速成为世界各地许多开发商的首选架构。自从这种架构构成以来,Stellaris产品系列一直遵循着其既定的目标--保证所提供的32位微控制器,具有高度的可连接性、适应范围又最为广泛的组合包,而且成本低,易于使用。最新的Stellaris LM4F系列更是优化了所提供的MCU,极大地改善了性能,提升了功能,使系列产品提高到一个新的质量水平。 Stellaris LM4F微控制器吸取了两类重
  3. 所属分类:硬件开发

    • 发布日期:2011-10-18
    • 文件大小:205824
    • 提供者:zslcn
  1. 基于最小生成树的全局优化立体匹配方法

  2. 基于最小生成树的全局优化立体匹配方法,全局优化,效果非常好,跑赢局部优化方法,效果刚刚的。并且已经进行了simd优化
  3. 所属分类:C++

    • 发布日期:2016-01-26
    • 文件大小:5242880
    • 提供者:wangyaninglm
  1. SIMD指令集大全

  2. SIMD指令集大全,对于数据的cpu加速处理的优化指令集。包括MMX、SSE以及部分AVX的指令集,开发过程中可以参考。
  3. 所属分类:C++

    • 发布日期:2018-08-13
    • 文件大小:850944
    • 提供者:u012058778
  1. ARM Neon优化指南

  2. NEON 技术可加速多媒体和信号处理算法(如视频编码/解码、2D/3D 图形、游戏、音频和语音处理、图像处理技术、电话和声音合成),其性能至少为ARMv5 性能的3倍,为 ARMv6 SIMD性能的2倍。 关于SIMD和SISD:Single Instruction Multiple Data,单指令多数据流。反之SISD是单指令单数据。以加法指令为例,单指令单数据(SISD)的CPU对加法指令译码后,执行部件先访问内存,取得第一个操作数;之后再一次访问内存,取得第二个操作数;随后才能进行求和
  3. 所属分类:C

    • 发布日期:2018-08-31
    • 文件大小:926720
    • 提供者:magic_andy2008
  1. SIMD指令大全

  2. Intel 关于SIMD的详细文档,适用于函数的优化,特别是和视频编解码相关
  3. 所属分类:C

    • 发布日期:2018-10-16
    • 文件大小:9437184
    • 提供者:gaopeng1111
  1. cpp-Nudge一个小型的数据导向和SIMD优化的3D刚体物理库

  2. Nudge 一个小型的数据导向和SIMD优化的3D刚体物理库
  3. 所属分类:其它

    • 发布日期:2019-08-16
    • 文件大小:247808
    • 提供者:weixin_39840924
  1. C程序性能优化 20个实验与达人技巧

  2. 从CPU与编译器的运行机制讲起,带领读者一步步了解程序的执行成本、编译器的优化选项等,总结出许多C程序性能优化的技巧,并以实验的方式进行了讲解,简明易懂,使人印象深刻。书中带有大量的代码实例,使读者不仅能够了解代码优化的原理,还能够轻松地在实践中应用。 第1章CPU与编译器概论   1.1高速路与人行道   1.2编译器是如何运作的   编译后的汇编语言程序   添加优化选项后的结果   1.3CPU是如何运作的   指令集架构与微架构   如何执行指令   指令流水线  
  3. 所属分类:C

    • 发布日期:2019-03-04
    • 文件大小:41943040
    • 提供者:channels
  1. 计算机高级体系结构——基于SIMD指令的程序优化

  2. 1. 学习可能使用到的SIMD Intrinsic函数; 2. 学习使用SIMD Intrinsic函数指令优化程序性能。 实验要求: 1. 学习基本SIMD Intrinsic函数的使用,并利用这些函数实现矩阵乘法。 2. 计算前两步的加速比。 a) 为了更好的体现加速比,要求适当增加矩阵的规模;并评估矩阵大小对加速比的影响。 b) 寻找并确认统计程序运行时间的方法并说明其合理性;
  3. 所属分类:其它

    • 发布日期:2020-06-23
    • 文件大小:2097152
    • 提供者:qq_33893619
  1. BWDSP SIMD编译的寄存器分配优化技术研究

  2. BWDSP是一款自主设计的国产VLIW(超长指令字)数字信号处理器,支持SIMD技术,其SIMD指令可以在4个宏上同时执行4个32位计算,对寄存器使用有特殊规则,Open64编译器的寄存器分配策略并不适用于这种规则。本文对BWDSP SIMD指令的寄存器分配优化技术进行了研究,并在BWDSP的编译器OCC上得以实现。
  3. 所属分类:其它

    • 发布日期:2020-07-27
    • 文件大小:98304
    • 提供者:weixin_38731239
  1. thermite:铝热SIMD-源码

  2. Thermite SIMD:融化您的CPU 注意:此板条箱尚未在crates.io上,但我确实拥有该名称,并将在准备好后将其发布在该板条上 Thermite是一个WIP SIMD库,致力于使用一致长度的1 SIMD向量进行锁步迭代和计算,从而提供SoA(阵列结构)算法的便携式SIMD加速。 Thermite为SSE2,SSE4.2,AVX和AVX2提供高度优化的功能丰富的后端,并计划支持AVX512,ARM / Aarch64 NEON和WASM SIMD扩展。 除此之外,Thermite包括
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:160768
    • 提供者:weixin_42166105
  1. pixel:C和SIMD进行图像处理,有时比OpenCV更快-源码

  2. 像素点 此回购包含一些有关基本图像处理的单独程序。 它主要是出于个人学习的目的,我将继续编写它们的朴素(纯C)和SIMD(ARM NEON,SSE)优化版本。 随时为该回购创建问题/观看/提出拉取请求。
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:15728640
    • 提供者:weixin_42130889
  1. colortwist:SIMD优化中的练习-源码

  2. 色捻 这是SIMD优化中的一点手指练习。 我们尝试优化的示例是称为“颜色扭曲”的图像处理操作。 它是RGB三元组和给定矩阵的矩阵乘积。 因此,如果我们具有源像素值r,g,b,则目标像素R,G,B的计算公式为 在哪里 是颜色扭曲矩阵。 有针对SIMD优化的版本,它们利用了(对于x86)和(对于ARM)。 有多快? 以下是一些数字(1MB = 1,000,000字节): ,msvc 19.27.29112,x64:2048x2048 RGB48位图 版本 性能(MB /秒) color
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:25600
    • 提供者:weixin_42131861
  1. eve:富有表现力的速度引擎-C ++中的SIMD出错了-源码

  2. EVE-表达向量引擎 目的 EVE是Falcou等人对旧的EVE SIMD库的重新实现。 有一段时间被命名为Boost.SIMD。 这是C ++ 20以及以后的实现,用于大多数当前体系结构的基于SIMD扩展集的基于类型的包装器。 它旨在说明如何使用C ++ 20来设计和实现适用于高性能的高效,低级,高抽象库。 首先是研究项目,其次是开放源代码库。 在第一个正式的0.1版本发布之前,我们保留更改所需的API和基准编译器的权利。 但是,我们将尽量减少干扰。 如果需要进行大量更改,语义版本控制将确保
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:3145728
    • 提供者:weixin_42169674
  1. fast_rsync:纯Rust中libbrsync的优化实现-源码

  2. fast_rsync 使用可用的SIMD操作在纯Rust中更快地实现 。 请注意,仅支持旧的MD4格式,不支持BLAKE2。 由于当前需要每晚Rust。 当前仅支持x86和x86-64体系结构。 rsync算法 此板条箱提供了三种主要的API: Signature::calculate ,它接收数据块并返回该数据的“签名”,该签名比原始数据小得多。 diff ,它为某个块A和一个数据B块签名,并返回块A和块B之间的增量。如果A和B是“相似的”,则该增量通常比块B小得多。 apply ,它
  3. 所属分类:其它

    • 发布日期:2021-02-11
    • 文件大小:35840
    • 提供者:weixin_42102933
  1. xsimd:用于SIMD内在函数和并行的,优化的数学函数(SSE,AVX,NEON,AVX512)的C ++包装器-源码

  2. xsimd:用于SIMD内在函数和并行的,优化的数学函数(SSE,AVX,NEON,AVX512)的C ++包装器
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:318464
    • 提供者:weixin_42169674
« 12 3 4 »