文件名称:
基于向量重构的聚类算法,特别是用于大规模文本收集
开发工具:
文件大小: 975kb
下载次数: 0
上传时间: 2021-03-24
详细说明:随着互联网技术的飞速发展,互联网用户每天都必须面对大量的文本数据。 显然,将文本分类可以帮助用户从大规模文本收集中挖掘有用的信息。 聚类由于其不受监督的特性,是对文本进行分类的最有前途的工具之一。 不幸的是,大多数传统的聚类算法在大规模文本收集上失去了高质量,这主要归因于文本之间的高维向量空间和语义相似性。 为了有效和高效地对大规模文本集合进行聚类,提出了一种基于向量重构的聚类算法。 在簇的代表向量中仅保留可以代表簇的特征。 该算法交替重复两个子过程,直到收敛为止。 一种过程是部分调整子过程,该过程通过类似于(SOM)算法的迭代过程来微调特征权重。 为了加快聚类速度,在该子过程中提出并实现了基于相交的相似度测量及其相应的神经元调节功能。 另一个过程是整体调整子过程,在此过程中,要素将重新分配到不同的群集中。 在此子过程中,从聚类的代表向量中删除了无用代表聚类的特征。 在三个文本集合(包括两个小规模和一个大文本集合)上的实验结果表明,我们的算法在小规模和大规模文本集合上均获得了高质量的性能。
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.