您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于核的K-均值聚类

  2. :将核学习方法的思想应用于K-均值聚类中,提出了一种核K-均值聚类算法,算法的主要思想是:首先将原空间中待聚类的样本经过 一个非线性映射,映射到一个高维的核空间中,突出各类样本之间的特征差异,然后在这个核空间中进行K-均值聚类。同时还将一种新的核 函数应用于核K-均值聚类中以提高算法的速度。为了验证算法的有效性,分别利用人工和实际数据进行K-均值聚类和核K-均值聚类,实验结 果显示对于一些特殊的类分布数据,核K-均值聚类比K-均值聚类具有更好的聚类效果
  3. 所属分类:其它

    • 发布日期:2009-12-24
    • 文件大小:141312
    • 提供者:qingchun456
  1. 数据挖掘原理与SPSS Clementine应用-聚类分析教程

  2. 聚类分析原理 聚类分析常用算法分类 划分聚类方法 层次聚类方法 基于密度的聚类方法 基于网格的聚类方法 基于模型的聚类方法 高维数据的聚类方法 模糊聚类FCM 应用实例分析
  3. 所属分类:其它

    • 发布日期:2010-01-11
    • 文件大小:174080
    • 提供者:yxinfa
  1. 采用属性聚类的高维子空间聚类算法_牛琨

  2. 为了解决现有子空间聚类算法时间复杂度偏高以及 对输入参数敏 感的问题, 提出了 一种基于 属性聚类方 法的高 效子空间聚类算法. 算法首先通过计算每个属性的基 尼值来过滤冗 余属性, 而后通过 基于二维 联合基尼值 的关系函数建立非冗余属性的关系矩阵, 以衡量任 意 2 个非 冗余属性的相 关度, 进而在关系 矩阵上应 用可产生交 叠的聚 类算法, 聚类结果即为所有兴趣度子空间的候选集合 , 最后调用聚类算法得到 所有存在于 这些子空 间内的簇.在人工数据集 和真实数据集上的实验表明, 新算法
  3. 所属分类:其它

    • 发布日期:2014-09-23
    • 文件大小:335872
    • 提供者:fanfan_121
  1. 一种快速的近邻传播聚类算法

  2. 近邻传播算法是一种快速有效的聚类方法.针对近邻传播算法在无先验知识条件下偏向参数选择的问题,使用Silhouette聚类有效性指标确定偏向参数.针对近邻传播算法在处理结构复杂或高维数据时,存在数据信息重叠的问题,提出将局部保持投影方法与近邻传播算法相结合的方法,在有效保留数据内部非线性结构的前提下,有效删除数据空间中的冗余信息.仿真结果验证了提出的算法优于传统的近邻传播算法.
  3. 所属分类:算法与数据结构

    • 发布日期:2017-10-23
    • 文件大小:2097152
    • 提供者:dwf_android
  1. 高维数据处理论文

  2. 高维数据的特征处理,降维方法,聚类研究等方面的文献
  3. 所属分类:搜索引擎

    • 发布日期:2018-05-10
    • 文件大小:19922944
    • 提供者:qiufengzouma
  1. 一种基于网格方法的高维数据流子空间聚类算法

  2. 基于对网格聚类方法的分析,结合由底向上的网格方法和自顶向下的网格方法,设计了一个能在线处理高维数据流的子空间聚类算法。通过利用由底向上网格方法对数据的压缩能力和自顶向下网格方法处理高维数据的能力,算法能基于对数据流的一次扫描,快速识别数据中位于不同子空间内的簇。理论分析以及在多个数据集上的实验表明算法具有较高的计算精度与计算效率。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-16
    • 文件大小:474112
    • 提供者:qq_28339273
  1. 多维数据集中高维数据可视化算法研究

  2. 多维数据集中包含海量的复杂高维数据,如何对这些数据进行科学的理解、分析和使用,是数据挖掘领域的一个重点和难点课题.针对传统可视化算法无法解决高维数据多属性的可视化问题,算法复杂、适用性较差的不足,提出基于快速数据聚类的可视化算法研究.算法构建了一种多维数据模型,采用三角多项式建立映射关系;对多维数据集做不同层次的划分,并基于聚类的效果筛选最佳聚类数;最后在平行坐标系基础上,对高维数据进行时序多维分析,提高算法鲁棒性.实验证明提出算法简洁易用,能够较好地实现对多维数据集中高维数据的理解和分析.
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-16
    • 文件大小:267264
    • 提供者:qq_28339273
  1. 聚类分析中的高维数据降维方法研究

  2. 高维数据能充分表达复杂事物的信息,但高维数据自身表达和处理复杂,妨碍了它的实际应用。阐述了用降维算法和构建索引结构来解决高维数据降维问题。以数据对象变异最大方向的投影作为特定数据对象集的主成份,将聚类分析引入高校数据资源的预处理环节,实现了数据对象集合的聚类归约。给出应用实例,为深入探索相关模式提供有效的分析方法。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-16
    • 文件大小:309248
    • 提供者:qq_28339273
  1. 一种基于海量高维数据的软子空间聚类改进算法

  2. 基于加权的软子空间聚类是处理高维数据的一种有效手段,在原有的软子空间聚类算法基础上对目标函数进行改进,从而结出一种新的软子空间聚类算法.相较之原算法,此算法具有更高的抗噪性及聚类效率;通过与典型的软子空间聚类算法比较试验,结果表明可有效提高海量高维数据的聚类处理效率.
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-16
    • 文件大小:1048576
    • 提供者:qq_28339273
  1. 可扩展双向聚类算法在煤炭领域中的研究与实现

  2. 随着现代信息技术的发展,各行各业产生了大量的高维数据,用不同的属性描述数据。煤炭产业也产生了大量的高维数据。煤炭企业的管理者往往希望从这些海量高维数据中得到更多的隐藏价值的知识。双向聚类算法被广泛地应用在各个领域中,该算法能够准确地完成聚类。随着数据规模呈现指数级地增长以及数据维度的增加,传统双向聚类算法不仅不能快速完成数据聚类,而且不能有效地处理高维数据。文章针对海量高维数据,提出了可扩展的基于高维数据的分布式双向聚类算法。通过实验结果展示了文中提出的算法具有很好的聚类结果以及很高的加速比及可
  3. 所属分类:其它

    • 发布日期:2020-07-06
    • 文件大小:842752
    • 提供者:weixin_38548717
  1. 基于向量重构的聚类算法,特别是用于大规模文本收集

  2. 随着互联网技术的飞速发展,互联网用户每天都必须面对大量的文本数据。 显然,将文本分类可以帮助用户从大规模文本收集中挖掘有用的信息。 聚类由于其不受监督的特性,是对文本进行分类的最有前途的工具之一。 不幸的是,大多数传统的聚类算法在大规模文本收集上失去了高质量,这主要归因于文本之间的高维向量空间和语义相似性。 为了有效和高效地对大规模文本集合进行聚类,提出了一种基于向量重构的聚类算法。 在簇的代表向量中仅保留可以代表簇的特征。 该算法交替重复两个子过程,直到收敛为止。 一种过程是部分调整子过程,该
  3. 所属分类:其它

    • 发布日期:2021-03-24
    • 文件大小:998400
    • 提供者:weixin_38694566
  1. 高维数据的三向决策聚类方法

  2. 高维数据的三向决策聚类方法
  3. 所属分类:其它

    • 发布日期:2021-03-23
    • 文件大小:233472
    • 提供者:weixin_38651540
  1. 基于局部约束的协同表示构造高维数据谱聚类的亲和矩阵

  2. 大多数的聚类算法都不适合对高维数据进行聚类,原因是“ 维度”。随着维度的增加,数据将变得稀疏,对象之间的距离趋于相同,并且嘈杂的功能也会增加。 它降低了聚类的有效性算法敏锐。 频谱聚类是一种面向图的子空间聚类方法,其关键是构造一个健壮的anity矩阵。 最近,稀疏表示(SR)和协作表示(CR)编码方案已被证明是有效的线性表示模型。 但是,它们不是数据嘈杂时足够强大。 局限性协作表示(LCR)已显示通过在分类中的CR编码方案中引入局部一致性来提高其对噪声和异常值的鲁棒性高维数据。 在本文中,我们建
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:294912
    • 提供者:weixin_38519763
  1. 基于谱正则化的非线性判别聚类

  2. 由于稀疏性,直接聚类高维数据仍然是一个难题。 因此,通过降维获得它们的低维紧凑表示是对高维数据进行聚类的有效方法。 但是,大多数现有的降维方法最初都是为分类(例如线性判别分析)或恢复高维数据的几何结构(称为流形)(例如局部线性嵌入)而开发的,而不是为了聚类的目的而开发的。 因此,提出了一种新的基于谱正则化的降维非线性判别聚类算法。 该方法的贡献有两个方面:(1)可以获得非线性的低维表示,可以恢复固有的流形结构并增强原始高维数据的聚类结构。 (2)也可以在降维过程中获得聚类结果。 首先,将所需的低
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:584704
    • 提供者:weixin_38699726
  1. 高维数据流的聚类离群点检测算法研究

  2. 针对基于聚类的离群点检测算法在处理高维数据流时效率和精确度低的问题,提出一种高维数据流的聚类离群点检测(CODHD-Stream)算法.该算法首先采用滑动窗口技术对数据流划分,然后通过属性约简算法对高维数据集降维;其次运用基于距离的信息熵过滤机制的K-means聚类算法将数据集划分成微聚类,并检测微聚类的离群点.通过实验结果分析表明:该算法可以有效提高高维数据流中离群点检测的效率和准确度.
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:4194304
    • 提供者:weixin_38627521
  1. 实时数据流聚类的研究新进展

  2. 实时数据流聚类是目前国际数据库和数据管理领域的新兴研究热点。综述了实时数据流聚类的最新研究进展,在介绍实时数据流聚类的相关理论和常用技术的基础上,对现有各种代表性算法的优势和不足进行了系统地分析,从处理速度、聚类形状、演化分析、高维性及噪声健壮性5个方面对算法的性能进行了比较。探讨了基于聚类的实时数据流演化分析方法及其局限性。最后展望了将来可能的研究方向。
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:460800
    • 提供者:weixin_38700779
  1. 图像高维数据的K-means自适应聚类算法

  2. 图像高维数据的K-means自适应聚类算法
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:286720
    • 提供者:weixin_38672815
  1. 美洲狮:由遗传算法支持的概念验证恶意软件行为聚类系统-源码

  2. 库加 使用遗传算法例程对未知恶意软件进行聚类 COUGAR是一个系统,能够减少高维恶意软件行为数据,并借助多目标遗传算法来优化该数据的聚类,以标记未知恶意软件。 此与以下论文相关: 和 。 2020年。COUGAR:使用遗传算法例程对未知恶意软件进行聚类。 在2020年7月8日至12日在墨西哥坎昆举行的遗传与进化计算会议( )上。 ACM,美国纽约,纽约,共9页。 建立 设置virtualenv: # This may require you to install the python
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:110592
    • 提供者:weixin_42100971
  1.  基于遗传算法的高维子空间聚类算法设计

  2. 针对高维空间数据的特点,为了降低“维数灾难效应”对聚类结果的影响,提出并实现了一种新的基于遗传算法的子空间聚类算法,通过特征选择方法并结合遗传算法的全局搜索能力对所有的特征子空间进行搜索;采用实数制编码方式对解空间进行编码,并设计一种基于距离和信息熵的适应度评估函数来对聚类结果和子空间所包含的特征维进行评估。最后,通过人工数据与真实数据等几组实验验证了算法的高效性和鲁棒性。实验结果表明,本文提出的新算法能够有效地进行高维数据聚类,降低“维数灾效应”的影响。
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:741376
    • 提供者:weixin_38593723
  1. 一种层次初始的聚类个数自适应的聚类方法研究

  2. K均值聚类算法是一种常见且有效的基于划分的聚类算法。为解决该聚类算法对初始中心敏感的问题,常用的方法是层次化初始聚类中心。然而,层次初始的聚类算法仍然需要将聚类个数作为输入参数,在高维数据和海量数据中不易应用。基于能够自动确定聚类数目的目的,采用DBI度量,提出一种层次初始的聚类个数自适应的聚类方法(简称DHIKM)。通过UCI数据集和仿真数据上的实验,证明DHIKM可以在采样数据中快速找到合适的聚类个数,实验结果表明该算法在聚类质量与收敛速度上的有效性。
  3. 所属分类:其它

    • 发布日期:2021-01-29
    • 文件大小:1048576
    • 提供者:weixin_38638647
« 12 3 4 5 »