搜索资源 - SIMD加速 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - SIMD加速

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

SSE技术文档 sse指令用法
SSE是指令集的简称，它包括70条指令，其中包含单指令多数据浮点计算、以及额外的SIMD整数和高速缓存控制指令。
所属分类：专业指导
- 发布日期：2010-12-18
- 文件大小：11264
- 提供者：chenmoo0821

基于可编程图形硬件加速的若干技术研究
目前图形硬件中的图形处理器(GPU)计算能力的增长速度已经超过了中央处理器 (CPU)计算能力的增长速度，主流图形硬件制造商声称，现在每隔 12 个月 GPU 的性能就会增长一倍。图形硬件技术一个最主要的突破就是在图形硬件中引入了可编程功能，此功能允许用户编制自定义的着色器程序(Shader program)来替换原来固定流水线中的某些功能模块，使得 GPU 在功能上更像一个通用处理器. 虽然 GPU 具有非常高的计算速度，但并不能直接将以前在 CPU 中实现的算法照搬到 GPU 中来
所属分类：其它
- 发布日期：2011-01-26
- 文件大小：2097152
- 提供者：chinachips

GPU通用计算
使用GPU进行计算工作，显卡加速破解， GPU SIMD等利用
所属分类：C
- 发布日期：2012-11-26
- 文件大小：340992
- 提供者：junbo_wu_c

AdaBoost+LBP人脸检测算法细节和时间消耗分析
主要是该算法的相关细节与算法时间消耗的分析，看从算法上的加速思路；目前有效的加速思路是提前终止判断，SIMD没有太好的处理方式。
所属分类：机器学习
- 发布日期：2017-09-08
- 文件大小：271360
- 提供者：artlife_sun

SIMD指令集大全
SIMD指令集大全，对于数据的cpu加速处理的优化指令集。包括MMX、SSE以及部分AVX的指令集，开发过程中可以参考。
所属分类：C++
- 发布日期：2018-08-13
- 文件大小：850944
- 提供者：u012058778

ARM Neon优化指南
NEON 技术可加速多媒体和信号处理算法（如视频编码/解码、2D/3D 图形、游戏、音频和语音处理、图像处理技术、电话和声音合成），其性能至少为ARMv5 性能的3倍，为 ARMv6 SIMD性能的2倍。关于SIMD和SISD：Single Instruction Multiple Data，单指令多数据流。反之SISD是单指令单数据。以加法指令为例，单指令单数据（SISD）的CPU对加法指令译码后，执行部件先访问内存，取得第一个操作数；之后再一次访问内存，取得第二个操作数；随后才能进行求和
所属分类：C
- 发布日期：2018-08-31
- 文件大小：926720
- 提供者：magic_andy2008

一文看懂基于SIMD的媒体处理器.rar
基于SIMD技术的媒体处理器在多媒体处理领域凭借着其良好的可编程性和高性能而备受关注。但是其性能的进一步提高却受制于一些非运算的因素，也就是通常所说的数据存储与组织。这主要是由多媒体处理的数据访问的灵活性和SIMD技术对算法的规整性的高度依赖性所导致。为了进一步的开发基于SIMD技术的媒体处理器的性能，本文分别从数据组织和存储两个方面来对其进行体系结构的优化。首先，在数据组织方面，本文提出了一种基于显式数据置换的 EDO．SIMD指令集体系结构。它将数据置换信息显式地声明在了指令字
所属分类：其它
- 发布日期：2019-07-23
- 文件大小：2097152
- 提供者：weixin_39840515

base64, 在c 中，使用SIMD加速，快速Base64流编码器/解码器.zip
base64, 在c 中，使用SIMD加速，快速Base64流编码器/解码器快速Base64流编码器/解码器This ( AVX2，NEON，aarch64/NEON，SSSE3，SSE4.1, SSE4.2, AVX ) 中的base64流编码/解码库的实现，带有SIMD和 OpenMP的加速。它还包含用于编
所属分类：其它
- 发布日期：2019-10-10
- 文件大小：75776
- 提供者：weixin_38743506

安卓用LibJpegTurbo 库(源码加 mk文件)
内容为安卓可用的 LibJpegTurbo库, 兼容LibJpeg(以下简称L-J),但比L-J增加了处理器指令优化, 因内部采用了SIMD加速. 所以速度比L-J快约一倍. 可用ndk-build进行编译.生成对应平台的so. 里面附上一个例子代码: decode_example.cpp , 用来简单示范图片压缩和解压的步骤. 存在部分伪代码,不能直接运行.
所属分类：Android
- 发布日期：2019-05-24
- 文件大小：833536
- 提供者：archmagee

计算机高级体系结构——基于SIMD指令的程序优化
1. 学习可能使用到的SIMD Intrinsic函数； 2. 学习使用SIMD Intrinsic函数指令优化程序性能。实验要求： 1. 学习基本SIMD　Intrinsic函数的使用，并利用这些函数实现矩阵乘法。 2. 计算前两步的加速比。 a) 为了更好的体现加速比，要求适当增加矩阵的规模；并评估矩阵大小对加速比的影响。 b) 寻找并确认统计程序运行时间的方法并说明其合理性；
所属分类：其它
- 发布日期：2020-06-23
- 文件大小：2097152
- 提供者：qq_33893619

thermite:铝热SIMD-源码
Thermite SIMD：融化您的CPU 注意：此板条箱尚未在crates.io上，但我确实拥有该名称，并将在准备好后将其发布在该板条上 Thermite是一个WIP SIMD库，致力于使用一致长度的1 SIMD向量进行锁步迭代和计算，从而提供SoA（阵列结构）算法的便携式SIMD加速。 Thermite为SSE2，SSE4.2，AVX和AVX2提供高度优化的功能丰富的后端，并计划支持AVX512，ARM / Aarch64 NEON和WASM SIMD扩展。除此之外，Thermite包括
所属分类：其它
- 发布日期：2021-03-18
- 文件大小：160768
- 提供者：weixin_42166105

cute-nucleotides:Rust中SIMD向量化核苷酸的二进制编码和解码的可爱技巧-源码
可爱的核苷酸 :dna: :laptop: Rust中SIMD向量化核苷酸的二进制编码和解码的可爱技巧。跑步要运行测试，请使用带有特殊标志的货物，告知其以您的CPU为目标，以实现最高效率。 RUSTFLAGS="-C target-cpu=native" cargo test 您还可以运行基准测试： RUSTFLAGS="-C target-cpu=native" cargo bench 这些都应在支持AVX2和BMI2指令的x86 CPU（因此，现代的Intel和AMD CPU）上
所属分类：其它
- 发布日期：2021-03-13
- 文件大小：20480
- 提供者：weixin_42139252

CMRF：可配置的矩阵寄存器文件，用于加速SIMD处理器上的矩阵操作
CMRF：可配置的矩阵寄存器文件，用于加速SIMD处理器上的矩阵操作
所属分类：其它
- 发布日期：2021-03-11
- 文件大小：391168
- 提供者：weixin_38612095

HEVC解码器在多核x86平台上的加速
在本文中，我们提出了一种基于CTU的混合了任务级并行度和数据级并行度的HEVC混合并行解码策略。数据级并行性使不同解码阶段的执行时间分布更加平衡，并使任务级并行性更加高效。我们的方法对位流没有任何限制，它们必须由可选的并行编码工具（例如tile或WPP）生成，因此可以应用于所有类型的HEVC位流。此外，SSE是X86平台上典型的SIMD指令集，用于加速耗时的模块，从而缩短了不同阶段之间的执行时间间隔，并使其易于并行处理。我们已经在HM-10.0解码器上实现了这些加速策略，并实现了很高
所属分类：其它
- 发布日期：2021-03-06
- 文件大小：252928
- 提供者：weixin_38596267

DCT和IDCT的高效SIMD加速实现高效视频编码
DCT和IDCT的高效SIMD加速实现高效视频编码
所属分类：其它
- 发布日期：2021-03-04
- 文件大小：961536
- 提供者：weixin_38660327

simd-fecfun：利用SIMD加速与FEC相关的功能-源码
SIMD-FECFUN 利用SIMD加速与FEC相关的功能
所属分类：其它
- 发布日期：2021-02-13
- 文件大小：8192
- 提供者：weixin_42140625

Blake3.NET：Blake3.NET是围绕BLAKE3加密哈希函数的SIMD Rust实现的快速托管包装器-源码
Blake3.NET Blake3.NET是加密哈希函数的SIMD Rust实现的快速托管包装。 Blake3.NET使用的当前BLAKE3本机版本为0.3.7 产品特点与.NET5.0 +兼容。与Span友好的API快速互操作。 API与相似。 CPU SIMD通过动态CPU功能检测加速了硬件。支持多个。通过Hasher增量更新API。通过Hasher.UpdateWithJoin支持多线程哈希。用法直接哈希一个缓冲区： var hash = Blake3 . H
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：1048576
- 提供者：weixin_42157556

嘈杂：SIMD加速产生噪音-源码
嘈杂：SIMD加速产生噪音
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：184320
- 提供者：weixin_42135754

pysimdjson：simdjson项目的Python绑定-源码
pysimdjson 项目的Python绑定，这是SIMD加速的JSON解析器。如果没有SIMD指令，则使用后备解析器，从而使pysimdjson在任何地方都可以安全使用。目前，绑定已在OS X，Linux和Windows上针对Python 3.5至3.9版进行测试。 :memo: 文献资料最新文档可在找到。如果您已签出源代码（例如查看PR），则可以通过运行cd docs && make html来构建最新文档。 :party_popper: 安装如果平台上有二元轮，则可以从
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：3145728
- 提供者：weixin_42134168

学习在kernel态下使用NEON对算法进行加速的方法
本文跟着小编一起来学习在linux kernel态下如何使用NEON对算法进行加速的技巧，内容通过图文实例给大家做了详细分析，一起来看下。 ARM处理器从cortex系列开始集成NEON处理单元，该单元可以简单理解为协处理器，专门为矩阵运算等算法设计，特别适用于图像、视频、音频处理等场景，应用也很广泛。本文先对NEON处理单元进行简要介绍，然后介绍如何在内核态下使用NEON，最后列举实例说明。一.NEON简介其实最好的资料就是官方文档，Cortex:trade_mark:-A Series
所属分类：其它
- 发布日期：2021-01-10
- 文件大小：1048576
- 提供者：weixin_38530536

« 12 3 »