点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - SIMD加速
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
SSE技术文档 sse指令用法
SSE是指令集的简称,它包括70条指令,其中包含单指令多数据浮点计算、以及额外的SIMD整数和高速缓存控制指令。
所属分类:
专业指导
发布日期:2010-12-18
文件大小:11264
提供者:
chenmoo0821
基于可编程图形硬件加速的若干技术研究
目前图形硬件中的图形处理器(GPU)计算能力的增长速度已经超过了中央处理器 (CPU)计算能力的增长速度,主流图形硬件制造商声称,现在每隔 12 个月 GPU 的性 能就会增长一倍。图形硬件技术一个最主要的突破就是在图形硬件中引入了可编程功 能,此功能允许用户编制自定义的着色器程序(Shader program)来替换原来固定流水线 中的某些功能模块,使得 GPU 在功能上更像一个通用处理器. 虽然 GPU 具有非常高 的计算速度,但并不能直接将以前在 CPU 中实现的算法照搬到 GPU 中来
所属分类:
其它
发布日期:2011-01-26
文件大小:2097152
提供者:
chinachips
GPU通用计算
使用GPU进行计算工作,显卡 加速 破解, GPU SIMD等利用
所属分类:
C
发布日期:2012-11-26
文件大小:340992
提供者:
junbo_wu_c
AdaBoost+LBP人脸检测算法细节和时间消耗分析
主要是该算法的相关细节与算法时间消耗的分析,看从算法上的加速思路;目前有效的加速思路是提前终止判断,SIMD没有太好的处理方式。
所属分类:
机器学习
发布日期:2017-09-08
文件大小:271360
提供者:
artlife_sun
SIMD指令集大全
SIMD指令集大全,对于数据的cpu加速处理的优化指令集。包括MMX、SSE以及部分AVX的指令集,开发过程中可以参考。
所属分类:
C++
发布日期:2018-08-13
文件大小:850944
提供者:
u012058778
ARM Neon优化指南
NEON 技术可加速多媒体和信号处理算法(如视频编码/解码、2D/3D 图形、游戏、音频和语音处理、图像处理技术、电话和声音合成),其性能至少为ARMv5 性能的3倍,为 ARMv6 SIMD性能的2倍。 关于SIMD和SISD:Single Instruction Multiple Data,单指令多数据流。反之SISD是单指令单数据。以加法指令为例,单指令单数据(SISD)的CPU对加法指令译码后,执行部件先访问内存,取得第一个操作数;之后再一次访问内存,取得第二个操作数;随后才能进行求和
所属分类:
C
发布日期:2018-08-31
文件大小:926720
提供者:
magic_andy2008
一文看懂基于SIMD的媒体处理器.rar
基于SIMD技术的媒体处理器在多媒体处理领域凭借着其良好的可 编程性和高性能而备受关注。但是其性能的进一步提高却受制于一些非 运算的因素,也就是通常所说的数据存储与组织。这主要是由多媒体处 理的数据访问的灵活性和SIMD技术对算法的规整性的高度依赖性所导 致。为了进一步的开发基于SIMD技术的媒体处理器的性能,本文分别 从数据组织和存储两个方面来对其进行体系结构的优化。 首先,在数据组织方面,本文提出了一种基于显式数据置换的 EDO.SIMD指令集体系结构。它将数据置换信息显式地声明在了指令字
所属分类:
其它
发布日期:2019-07-23
文件大小:2097152
提供者:
weixin_39840515
base64, 在c 中,使用SIMD加速,快速Base64流编码器/解码器.zip
base64, 在c 中,使用SIMD加速,快速Base64流编码器/解码器 快速Base64流编码器/解码器This ( AVX2,NEON,aarch64/NEON,SSSE3,SSE4.1, SSE4.2, AVX ) 中的base64流编码/解码库的实现,带有SIMD和 OpenMP的加速。 它还包含用于编
所属分类:
其它
发布日期:2019-10-10
文件大小:75776
提供者:
weixin_38743506
安卓用LibJpegTurbo 库(源码加 mk文件)
内容为安卓可用的 LibJpegTurbo库, 兼容LibJpeg(以下简称L-J),但比L-J增加了处理器指令优化, 因内部采用了SIMD加速. 所以速度比L-J快约一倍. 可用ndk-build进行编译.生成对应平台的so. 里面附上一个例子代码: decode_example.cpp , 用来简单示范图片压缩和解压的步骤. 存在部分伪代码,不能直接运行.
所属分类:
Android
发布日期:2019-05-24
文件大小:833536
提供者:
archmagee
计算机高级体系结构——基于SIMD指令的程序优化
1. 学习可能使用到的SIMD Intrinsic函数; 2. 学习使用SIMD Intrinsic函数指令优化程序性能。 实验要求: 1. 学习基本SIMD Intrinsic函数的使用,并利用这些函数实现矩阵乘法。 2. 计算前两步的加速比。 a) 为了更好的体现加速比,要求适当增加矩阵的规模;并评估矩阵大小对加速比的影响。 b) 寻找并确认统计程序运行时间的方法并说明其合理性;
所属分类:
其它
发布日期:2020-06-23
文件大小:2097152
提供者:
qq_33893619
thermite:铝热SIMD-源码
Thermite SIMD:融化您的CPU 注意:此板条箱尚未在crates.io上,但我确实拥有该名称,并将在准备好后将其发布在该板条上 Thermite是一个WIP SIMD库,致力于使用一致长度的1 SIMD向量进行锁步迭代和计算,从而提供SoA(阵列结构)算法的便携式SIMD加速。 Thermite为SSE2,SSE4.2,AVX和AVX2提供高度优化的功能丰富的后端,并计划支持AVX512,ARM / Aarch64 NEON和WASM SIMD扩展。 除此之外,Thermite包括
所属分类:
其它
发布日期:2021-03-18
文件大小:160768
提供者:
weixin_42166105
cute-nucleotides:Rust中SIMD向量化核苷酸的二进制编码和解码的可爱技巧-源码
可爱的核苷酸 :dna: :laptop: Rust中SIMD向量化核苷酸的二进制编码和解码的可爱技巧。 跑步 要运行测试,请使用带有特殊标志的货物,告知其以您的CPU为目标,以实现最高效率。 RUSTFLAGS="-C target-cpu=native" cargo test 您还可以运行基准测试: RUSTFLAGS="-C target-cpu=native" cargo bench 这些都应在支持AVX2和BMI2指令的x86 CPU(因此,现代的Intel和AMD CPU)上
所属分类:
其它
发布日期:2021-03-13
文件大小:20480
提供者:
weixin_42139252
CMRF:可配置的矩阵寄存器文件,用于加速SIMD处理器上的矩阵操作
CMRF:可配置的矩阵寄存器文件,用于加速SIMD处理器上的矩阵操作
所属分类:
其它
发布日期:2021-03-11
文件大小:391168
提供者:
weixin_38612095
HEVC解码器在多核x86平台上的加速
在本文中,我们提出了一种基于CTU的混合了任务级并行度和数据级并行度的HEVC混合并行解码策略。 数据级并行性使不同解码阶段的执行时间分布更加平衡,并使任务级并行性更加高效。 我们的方法对位流没有任何限制,它们必须由可选的并行编码工具(例如tile或WPP)生成,因此可以应用于所有类型的HEVC位流。 此外,SSE是X86平台上典型的SIMD指令集,用于加速耗时的模块,从而缩短了不同阶段之间的执行时间间隔,并使其易于并行处理。 我们已经在HM-10.0解码器上实现了这些加速策略,并实现了很高
所属分类:
其它
发布日期:2021-03-06
文件大小:252928
提供者:
weixin_38596267
DCT和IDCT的高效SIMD加速实现高效视频编码
DCT和IDCT的高效SIMD加速实现高效视频编码
所属分类:
其它
发布日期:2021-03-04
文件大小:961536
提供者:
weixin_38660327
simd-fecfun:利用SIMD加速与FEC相关的功能-源码
SIMD-FECFUN 利用SIMD加速与FEC相关的功能
所属分类:
其它
发布日期:2021-02-13
文件大小:8192
提供者:
weixin_42140625
Blake3.NET:Blake3.NET是围绕BLAKE3加密哈希函数的SIMD Rust实现的快速托管包装器-源码
Blake3.NET Blake3.NET是加密哈希函数的SIMD Rust实现的快速托管包装。 Blake3.NET使用的当前BLAKE3本机版本为0.3.7 产品特点 与.NET5.0 +兼容。 与Span友好的API快速互操作。 API与相似。 CPU SIMD通过动态CPU功能检测加速了硬件。 支持多个。 通过Hasher增量更新API。 通过Hasher.UpdateWithJoin支持多线程哈希。 用法 直接哈希一个缓冲区: var hash = Blake3 . H
所属分类:
其它
发布日期:2021-02-05
文件大小:1048576
提供者:
weixin_42157556
嘈杂:SIMD加速产生噪音-源码
嘈杂:SIMD加速产生噪音
所属分类:
其它
发布日期:2021-02-04
文件大小:184320
提供者:
weixin_42135754
pysimdjson:simdjson项目的Python绑定-源码
pysimdjson 项目的Python绑定,这是SIMD加速的JSON解析器。 如果没有SIMD指令,则使用后备解析器,从而使pysimdjson在任何地方都可以安全使用。 目前,绑定已在OS X,Linux和Windows上针对Python 3.5至3.9版进行测试。 :memo: 文献资料 最新文档可在找到。 如果您已签出源代码(例如查看PR),则可以通过运行cd docs && make html来构建最新文档。 :party_popper: 安装 如果平台上有二元轮,则可以从
所属分类:
其它
发布日期:2021-02-03
文件大小:3145728
提供者:
weixin_42134168
学习在kernel态下使用NEON对算法进行加速的方法
本文跟着小编一起来学习在linux kernel态下如何使用NEON对算法进行加速的技巧,内容通过图文实例给大家做了详细分析,一起来看下。 ARM处理器从cortex系列开始集成NEON处理单元,该单元可以简单理解为协处理器,专门为矩阵运算等算法设计,特别适用于图像、视频、音频处理等场景,应用也很广泛。 本文先对NEON处理单元进行简要介绍,然后介绍如何在内核态下使用NEON,最后列举实例说明。 一.NEON简介 其实最好的资料就是官方文档,Cortex:trade_mark:-A Series
所属分类:
其它
发布日期:2021-01-10
文件大小:1048576
提供者:
weixin_38530536
«
1
2
3
»