开发工具:
文件大小: 7mb
下载次数: 0
上传时间: 2013-06-08
详细说明: 随着当今信息技术的高速发展,人们日常生产生活中产生的数据量呈现出爆 发式增长。因此,对于海量数据集的处理已成为数据挖掘技术的主要挑战。而如 何能以高性价比的方式挖掘到有价值的信息是目前数据挖掘研究的新课题。 GPu通用计算技术的R益成熟为数据挖掘技术的发展注入了新的动力。 GPU通过与CPu截然不同的发展路线,由当初的专用图形处理器一步步走进今 天的通用计算领域,并且正在向传统架构的超级计算机发起挑战。很显然,数 据挖掘这类计算密集型应用也必将受益于现代GPU所提供的廉价大规模并行计 算能力。 关联规则是数据挖掘的重要技术之一,而其中的频繁项集计算任务又是整 个算法的核心,研究如何利用GPu通用计算技术来加速频繁项集挖掘具有一定 的理论与实际意义。本文通过分析与总结过去关于频繁项集挖掘的研究成果, 设计了一种基于OpencL的CPU+GPU异构执行的挖掘算法,利用OpenCL创 建大规模并发线程来加速计算Apriori算法中的计算密集部分。实验采用OpenCL 的Java绑定接口来具体实现,并选择了同一级别的CPu与GPu用于改进后算 法与原算法的性能对比测试。实验结果表明,改进算法对于稀疏数据集有更好 的加速性能,并且随着支持度的降低,加速比呈现扩大 趋势,最高达到约20倍。 另外,本文初步讨论并实验了利用0penCL的LocalMemory机制来对事务数据 的访问作进一步优化。不过,最后的测试结果表明这种改进仅对稠密数据集产 生了约10%的性能提升。本文在最后还指出了一些未来值得进一步研究与改进 的方向。 ...展开收缩
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.