文件名称:
一种使用N-list快速挖掘频繁项集的新算法
开发工具:
文件大小: 1mb
下载次数: 0
上传时间: 2021-03-16
详细说明:频繁项目集的挖掘已成为数据挖掘中的一个基本问题,并且在许多重要的数据挖掘任务中发挥着至关重要的作用。 在本文中,我们提出了一种新颖的垂直数据表示形式,称为N-list,该表示形式源自于一种类似于FP-tree的编码前缀树(称为PPC-tree),该树存储了有关频繁项集的关键信息。 基于N列表数据结构,我们开发了一种有效的挖掘算法PrePost,用于挖掘所有频繁项集。 PrePost的效率是通过以下三个原因实现的。 首先,N-list是紧凑的,因为具有公共前缀的事务共享PPC树的相同节点。 其次,将项目集支持的计数转换为N个列表的交集,并且可以通过有效策略将两个N个列表相交的复杂度降低为O(m + n),其中m和n是基数的基数。两个N列表。 第三,在某些情况下,PrePost可以通过使用N-list的单路径属性直接找到频繁的项目集,而无需生成候选项目集。 我们已针对四种最先进的算法对PrePost进行了实验评估,这些算法可在各种真实和合成数据集上挖掘频繁项集。 实验结果表明,PrePost算法在大多数情况下是最快的。 即使当数据集稀疏时该算法消耗了更多的内存,它仍然是最快的算法。
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.