您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. SSE技术文档 sse指令用法

  2. SSE是指令集的简称,它包括70条指令,其中包含单指令多数据浮点计算、以及额外的SIMD整数和高速缓存控制指令。
  3. 所属分类:专业指导

    • 发布日期:2010-12-18
    • 文件大小:11264
    • 提供者:chenmoo0821
  1. 基于可编程图形硬件加速的若干技术研究

  2. 目前图形硬件中的图形处理器(GPU)计算能力的增长速度已经超过了中央处理器 (CPU)计算能力的增长速度,主流图形硬件制造商声称,现在每隔 12 个月 GPU 的性 能就会增长一倍。图形硬件技术一个最主要的突破就是在图形硬件中引入了可编程功 能,此功能允许用户编制自定义的着色器程序(Shader program)来替换原来固定流水线 中的某些功能模块,使得 GPU 在功能上更像一个通用处理器. 虽然 GPU 具有非常高 的计算速度,但并不能直接将以前在 CPU 中实现的算法照搬到 GPU 中来
  3. 所属分类:其它

    • 发布日期:2011-01-26
    • 文件大小:2097152
    • 提供者:chinachips
  1. GPU通用计算

  2. 使用GPU进行计算工作,显卡 加速 破解, GPU SIMD等利用
  3. 所属分类:C

    • 发布日期:2012-11-26
    • 文件大小:340992
    • 提供者:junbo_wu_c
  1. AdaBoost+LBP人脸检测算法细节和时间消耗分析

  2. 主要是该算法的相关细节与算法时间消耗的分析,看从算法上的加速思路;目前有效的加速思路是提前终止判断,SIMD没有太好的处理方式。
  3. 所属分类:机器学习

    • 发布日期:2017-09-08
    • 文件大小:271360
    • 提供者:artlife_sun
  1. SIMD指令集大全

  2. SIMD指令集大全,对于数据的cpu加速处理的优化指令集。包括MMX、SSE以及部分AVX的指令集,开发过程中可以参考。
  3. 所属分类:C++

    • 发布日期:2018-08-13
    • 文件大小:850944
    • 提供者:u012058778
  1. ARM Neon优化指南

  2. NEON 技术可加速多媒体和信号处理算法(如视频编码/解码、2D/3D 图形、游戏、音频和语音处理、图像处理技术、电话和声音合成),其性能至少为ARMv5 性能的3倍,为 ARMv6 SIMD性能的2倍。 关于SIMD和SISD:Single Instruction Multiple Data,单指令多数据流。反之SISD是单指令单数据。以加法指令为例,单指令单数据(SISD)的CPU对加法指令译码后,执行部件先访问内存,取得第一个操作数;之后再一次访问内存,取得第二个操作数;随后才能进行求和
  3. 所属分类:C

    • 发布日期:2018-08-31
    • 文件大小:926720
    • 提供者:magic_andy2008
  1. 一文看懂基于SIMD的媒体处理器.rar

  2. 基于SIMD技术的媒体处理器在多媒体处理领域凭借着其良好的可 编程性和高性能而备受关注。但是其性能的进一步提高却受制于一些非 运算的因素,也就是通常所说的数据存储与组织。这主要是由多媒体处 理的数据访问的灵活性和SIMD技术对算法的规整性的高度依赖性所导 致。为了进一步的开发基于SIMD技术的媒体处理器的性能,本文分别 从数据组织和存储两个方面来对其进行体系结构的优化。 首先,在数据组织方面,本文提出了一种基于显式数据置换的 EDO.SIMD指令集体系结构。它将数据置换信息显式地声明在了指令字
  3. 所属分类:其它

    • 发布日期:2019-07-23
    • 文件大小:2097152
    • 提供者:weixin_39840515
  1. base64, 在c 中,使用SIMD加速,快速Base64流编码器/解码器.zip

  2. base64, 在c 中,使用SIMD加速,快速Base64流编码器/解码器 快速Base64流编码器/解码器This ( AVX2,NEON,aarch64/NEON,SSSE3,SSE4.1, SSE4.2, AVX ) 中的base64流编码/解码库的实现,带有SIMD和 OpenMP的加速。 它还包含用于编
  3. 所属分类:其它

    • 发布日期:2019-10-10
    • 文件大小:75776
    • 提供者:weixin_38743506
  1. 安卓用LibJpegTurbo 库(源码加 mk文件)

  2. 内容为安卓可用的 LibJpegTurbo库, 兼容LibJpeg(以下简称L-J),但比L-J增加了处理器指令优化, 因内部采用了SIMD加速. 所以速度比L-J快约一倍. 可用ndk-build进行编译.生成对应平台的so. 里面附上一个例子代码: decode_example.cpp , 用来简单示范图片压缩和解压的步骤. 存在部分伪代码,不能直接运行.
  3. 所属分类:Android

    • 发布日期:2019-05-24
    • 文件大小:833536
    • 提供者:archmagee
  1. 计算机高级体系结构——基于SIMD指令的程序优化

  2. 1. 学习可能使用到的SIMD Intrinsic函数; 2. 学习使用SIMD Intrinsic函数指令优化程序性能。 实验要求: 1. 学习基本SIMD Intrinsic函数的使用,并利用这些函数实现矩阵乘法。 2. 计算前两步的加速比。 a) 为了更好的体现加速比,要求适当增加矩阵的规模;并评估矩阵大小对加速比的影响。 b) 寻找并确认统计程序运行时间的方法并说明其合理性;
  3. 所属分类:其它

    • 发布日期:2020-06-23
    • 文件大小:2097152
    • 提供者:qq_33893619
  1. thermite:铝热SIMD-源码

  2. Thermite SIMD:融化您的CPU 注意:此板条箱尚未在crates.io上,但我确实拥有该名称,并将在准备好后将其发布在该板条上 Thermite是一个WIP SIMD库,致力于使用一致长度的1 SIMD向量进行锁步迭代和计算,从而提供SoA(阵列结构)算法的便携式SIMD加速。 Thermite为SSE2,SSE4.2,AVX和AVX2提供高度优化的功能丰富的后端,并计划支持AVX512,ARM / Aarch64 NEON和WASM SIMD扩展。 除此之外,Thermite包括
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:160768
    • 提供者:weixin_42166105
  1. cute-nucleotides:Rust中SIMD向量化核苷酸的二进制编码和解码的可爱技巧-源码

  2. 可爱的核苷酸 :dna: :laptop: Rust中SIMD向量化核苷酸的二进制编码和解码的可爱技巧。 跑步 要运行测试,请使用带有特殊标志的货物,告知其以您的CPU为目标,以实现最高效率。 RUSTFLAGS="-C target-cpu=native" cargo test 您还可以运行基准测试: RUSTFLAGS="-C target-cpu=native" cargo bench 这些都应在支持AVX2和BMI2指令的x86 CPU(因此,现代的Intel和AMD CPU)上
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:20480
    • 提供者:weixin_42139252
  1. CMRF:可配置的矩阵寄存器文件,用于加速SIMD处理器上的矩阵操作

  2. CMRF:可配置的矩阵寄存器文件,用于加速SIMD处理器上的矩阵操作
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:391168
    • 提供者:weixin_38612095
  1. HEVC解码器在多核x86平台上的加速

  2. 在本文中,我们提出了一种基于CTU的混合了任务级并行度和数据级并行度的HEVC混合并行解码策略。 数据级并行性使不同解码阶段​​的执行时间分布更加平衡,并使任务级并行性更加高效。 我们的方法对位流没有任何限制,它们必须由可选的并行编码工具(例如tile或WPP)生成,因此可以应用于所有类型的HEVC位流。 此外,SSE是X86平台上典型的SIMD指令集,用于加速耗时的模块,从而缩短了不同阶段之间的执行时间间隔,并使其易于并行处理。 我们已经在HM-10.0解码器上实现了这些加速策略,并实现了很高
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:252928
    • 提供者:weixin_38596267
  1. DCT和IDCT的高效SIMD加速实现高效视频编码

  2. DCT和IDCT的高效SIMD加速实现高效视频编码
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:961536
    • 提供者:weixin_38660327
  1. simd-fecfun:利用SIMD加速与FEC相关的功能-源码

  2. SIMD-FECFUN 利用SIMD加速与FEC相关的功能
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:8192
    • 提供者:weixin_42140625
  1. Blake3.NET:Blake3.NET是围绕BLAKE3加密哈希函数的SIMD Rust实现的快速托管包装器-源码

  2. Blake3.NET Blake3.NET是加密哈希函数的SIMD Rust实现的快速托管包装。 Blake3.NET使用的当前BLAKE3本机版本为0.3.7 产品特点 与.NET5.0 +兼容。 与Span友好的API快速互操作。 API与相似。 CPU SIMD通过动态CPU功能检测加速了硬件。 支持多个。 通过Hasher增量更新API。 通过Hasher.UpdateWithJoin支持多线程哈希。 用法 直接哈希一个缓冲区: var hash = Blake3 . H
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:1048576
    • 提供者:weixin_42157556
  1. 嘈杂:SIMD加速产生噪音-源码

  2. 嘈杂:SIMD加速产生噪音
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:184320
    • 提供者:weixin_42135754
  1. pysimdjson:simdjson项目的Python绑定-源码

  2. pysimdjson 项目的Python绑定,这是SIMD加速的JSON解析器。 如果没有SIMD指令,则使用后备解析器,从而使pysimdjson在任何地方都可以安全使用。 目前,绑定已在OS X,Linux和Windows上针对Python 3.5至3.9版进行测试。 :memo: 文献资料 最新文档可在找到。 如果您已签出源代码(例如查看PR),则可以通过运行cd docs && make html来构建最新文档。 :party_popper: 安装 如果平台上有二元轮,则可以从
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:3145728
    • 提供者:weixin_42134168
  1. 学习在kernel态下使用NEON对算法进行加速的方法

  2. 本文跟着小编一起来学习在linux kernel态下如何使用NEON对算法进行加速的技巧,内容通过图文实例给大家做了详细分析,一起来看下。 ARM处理器从cortex系列开始集成NEON处理单元,该单元可以简单理解为协处理器,专门为矩阵运算等算法设计,特别适用于图像、视频、音频处理等场景,应用也很广泛。 本文先对NEON处理单元进行简要介绍,然后介绍如何在内核态下使用NEON,最后列举实例说明。 一.NEON简介 其实最好的资料就是官方文档,Cortex:trade_mark:-A Series
  3. 所属分类:其它

    • 发布日期:2021-01-10
    • 文件大小:1048576
    • 提供者:weixin_38530536
« 12 3 »