您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 聚类分析阅读材料

  2. 内容指导: 1、基础的聚类方法:kmeans和等级聚类 2、dbscan方法以及其一些改进 3、混合正态下的EM算法及其变量选择 4、一个聚类变量选择的框架 5、对50年来kmeans聚类算法的非常好的综述。(提到能够解决各种问题的很多方法,参考文献很多,但是没有具体讲方法的步骤。)
  3. 所属分类:Java

    • 发布日期:2014-12-10
    • 文件大小:6291456
    • 提供者:demoscai
  1. K-Means聚类算法研究及图形演示的实现

  2. 常见聚类算法K-Means图文介绍,通熟易懂
  3. 所属分类:算法与数据结构

    • 发布日期:2017-08-18
    • 文件大小:575488
    • 提供者:luojlu
  1. 大数据挖掘技术与应用

  2. 本书针对数据的海量性、复杂性、高维性、模糊性和不完整性,对数据挖掘技术中的聚类分析和关联规则分析进行了系统的研究。设计与实现了基于密度和自适应密度可达聚类算法、基于簇特征的动态增量聚类算法、并行聚类算法、基于密度加权的模糊聚类算法、高唯复杂数据聚类算法、基于数据场的聚类算法、基于距离的量化关联规则和基于数据场的量化关联规则算法,给出了在矿产资源评价、遥感图像分类、矿业经济分析中的应用例证。全书共分11章,主要内容包括:绪论,基于密度和密度可达聚类分析,基于簇特征的动态增量聚类分析,并行聚类分析
  3. 所属分类:算法与数据结构

    • 发布日期:2018-01-08
    • 文件大小:113246208
    • 提供者:q1457797371
  1. 基于混合网格划分的子空间高维数据聚类算法

  2. 提出一种基于混合网格划分的子空间高维数据聚类算法。该算法消除了各个属性分量数值范围大小对计算的影响;有效去除冗余属性以提高聚类准确性与降低时间复杂度。根据数据分布情况灵活选择固定网格划分或是自适应网格划分,利用这二种不同的网格划分方法具有的优点,以实现进一步降低算法的时间复杂度和提高聚类结果的准确性,并使算法具有更优的可伸缩性。实验使用仿真数据表明,该算法在处理具有属性值域范围大的高维大规模数据时是实用有效的。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-16
    • 文件大小:246784
    • 提供者:qq_28339273
  1. 基于粒子群空间重组的大数据优化聚类算法

  2. 大数据聚类在模式识别和故障诊断等领域具有较好的应用价值。提出一种基于粒子群空间重组的大数据优化聚类算法。首先分析了标准粒子群算法,研究粒子群算法实现大数据聚类的原理。采用粒子群空间重组方法实现对大数据信息流特征矢量重构和提取,实现优化聚类。仿真结果表明,采用该算法进行大数据聚类,能有效提高数据分类的准确性,降低误分率,提高了数据挖掘和特征提取性能。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-19
    • 文件大小:1048576
    • 提供者:qq_28339273
  1. 面向位置大数据的快速密度聚类算法

  2. 本文面向位置大数据聚类,提出了一种简单但高效的快速密度聚类算法CBSCAN,以快速发现位置大数据中任意形状的聚类簇模式和噪声.首先,定义了Cell网格概念,并提出了基于Cell的距离分析理论,利用该距离分析,无需距离计算,可快速确定高密度区域的核心点和密度相连关系;其次,给出了网格簇定义,将基于位置点的密度簇映射成基于网格的密度簇,利用排他网格与相邻网格的密度关系,可快速确定网格簇的包含网格;第三,利用基于Cell的距离分析理论和网格簇概念,实现了一个快速密度聚类算法,将DBSCAN基于数据点
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-20
    • 文件大小:4194304
    • 提供者:qq_28339273
  1. 大数据分析 -- 聚类 算法

  2. 聚类分析 掌握K-means聚类的思路和使用条件 •掌握谱聚类的算法 –考虑谱聚类和PCA的关系 •理解密度聚类并能够应用于实践 –DBSCAN –密度最大值聚类
  3. 所属分类:算法与数据结构

    • 发布日期:2018-07-20
    • 文件大小:4194304
    • 提供者:qilong0
  1. Spark 聚类ppt

  2. 公司内部讲解使用的ppt,主要介绍了聚类的用处、聚类的常见方法和spark中聚类的使用。
  3. 所属分类:机器学习

    • 发布日期:2018-08-09
    • 文件大小:6291456
    • 提供者:wzmfla
  1. 海量用电数据并行聚类分析

  2. 针对用电数据量大、用电数据挖掘效率低等问题,采用理论分析和实验的方法,进行用电数据并行分析构架的研究,研究了Canopy和K-means两种典型的聚类算法,提出一种新的聚类思路,使用Canopy先对用电数据进行粗略处理,得到聚类个数和聚类中心,再用K-means精确聚类,既利用了K-means算法简单、收敛速度快的优势,又使其不容易陷入局部最优.为达到处理海量数据的目的,把提出的算法部署到MapReduce框架上进行实验.研究结果表明:提出的算法在海量用电数据的处理方面高效可行,并且具有良好的加
  3. 所属分类:其它

    • 发布日期:2020-06-28
    • 文件大小:585728
    • 提供者:weixin_38547409
  1. 不完整多模态数据聚类.docx

  2. 实际数据通常具有多种模态或来自多种异构源,因此形成了所谓的多视图数据,该数据在机器学习中越来越受到关注。多视图聚类(Multi-view clustering ,MVC)成为其重要的范例。在实际的应用程序中,某些视图通常会丢失实例。在这种多视图数据集上的聚类称为不完全多视图聚类(Incomplete multi-view clustering,IMC),并且具有很大的挑战性。
  3. 所属分类:讲义

    • 发布日期:2020-07-24
    • 文件大小:1048576
    • 提供者:RONNIE_Zz
  1. 一种K-means聚类算法的改进与应用

  2. K-means算法是基于距离作为相似性度量的聚类算法,传统的K-means算法存在难以确定中心值个数、受噪声及孤立点影响较大的缺点。对此,利用类间相异度与类内相异度改进初始值K,以尽量减少人工干预;同时计算数据库中每一点与剩余点的距离和距离均和,将两者的大小比较作为识别孤立点和噪声点的依据,从而删除孤立点,减少对数据聚类划分的影响。最后将改进后的K-means算法应用于入侵检测系统并进行仿真实验,结果表明,基于改进的K-means算法的入侵检测系统一定程度上降低了误报率及误检率,提高了检测的准确
  3. 所属分类:其它

    • 发布日期:2020-10-17
    • 文件大小:514048
    • 提供者:weixin_38717359
  1. 基于Hadoop的物流历史数据聚类挖掘研究

  2. 数据不仅是一种资源,更是一种财富。在大数据应用领域中,金融数据分析被视为一个很有前景的方向。股票分析一直是金融领域一个很热门的话题,而且涉及多个领域的知识。在此之前,人们更多的是采用基本分析,即通过宏观及微观的经济政策、本行业领域的发展状况、投资者的行为态度、反映企业自身发展状况的指标等方面来预测股票今后走势。随着大数据相关技术的发展,在海量的股票历史数据中发现规律进而预测股票走势成为一个很热门的研究课题。本文是对股票大数据进行聚类分析,本文的主要工作如下:1、数据收集。通过python爬虫以及
  3. 所属分类:交通

    • 发布日期:2020-12-01
    • 文件大小:3145728
    • 提供者:kamo54
  1. K-means聚类算法

  2. 聚类 “类”指的是具有相似性的集合,聚类是指将数据集划分为若干类,使得各个类之内的数据最为相似,而各个类之间的数据相似度差别尽可能的大。聚类分析就是以相似性为基础,在一个聚类中的模式之间比不在同一个聚类中的模式之间具有更多的相似性。对数据集进行聚类划分,属于无监督学习。 K-Means聚类算法 是无监督学习的一种。 K-Means算法是一种简单的迭代型聚类算法,采用距离作为相似性指标,从而发现给定数据集中的K个类,且每个类的中心是根据类中所有数值的均值得到的,每个类的中心用聚类中心来描述。 算法
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:146432
    • 提供者:weixin_38705788
  1. 一种基于相似度概率的不确定分类数据聚类算法

  2. 针对不确定分类数据,基于Squeezer算法提出一种有效的不确定数据聚类算法:USqueezer算法。该算法先计算一个不确定分类数据与每个簇的相似度概率和,选取最大的相似度和给定的阈值相比较,若大于阈值,将不确定数据划分到该簇中,否则创建一个新簇。实验表明,USqueezer算法能够有效地进行不确定分类数据的聚类,并且占用较少的运行内存空间和运行时间。
  3. 所属分类:其它

    • 发布日期:2021-03-01
    • 文件大小:245760
    • 提供者:weixin_38709100
  1. 一种用于分类数据聚类的数据标记方法

  2. 随着数据规模的快速增长,群集非常大的数据集不可避免地会耗时。 为了提高聚类的效率,通常使用抽样来缩小数据集的大小。 但是,在应用采样后,如何将未标记的对象分配到适当的群集中是一个非常困难的问题。 本文基于给定聚类中属性值的频率和不同聚类中属性值的分布,提出了一种新颖的相似性度量,将每个未标记的对象分配到相应的适当聚类中,以对分类数据进行聚类。 提出了分类数据的标注算法,并分析了其对应的时间复杂度。 实际数据集上的实验表明了该算法的有效性。
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:205824
    • 提供者:weixin_38630612
  1. 学习马氏距离度量以进行数据聚类和分类

  2. 距离度量是许多机器学习算法中的关键问题。 本文考虑了必须以链接和不能链接的形式从成对约束中学习的一般问题。 作为一种辅助信息,必须链接表示两个数据点对必须在同一类中,而不能链接表示两个数据点必须在两个不同类中。 给定必须链接和不能链接的信息,我们的目标是学习马氏距离度量。 在此度量标准下,我们希望必须链接中的点对的距离尽可能小,而不能链接中的点对的距离则尽可能大。 将该任务表述为一个约束优化问题,可以有效,高效地获得全局最优值。 最后,给出了在数据聚类,交互式自然图像分割和人脸姿态估计中的一些应
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:917504
    • 提供者:weixin_38660579
  1. 基于改进量子旋转门的量子进化数据聚类

  2. 在量子进化计算中, 量子旋转门是种群进化的主要算子, 但是该算子旋转角度的选取是离散且固定的, 使问题的搜索容易陷入局部最优. 因此, 本文提出了一种改进的量子旋转门算子, 它能够自适应地计算旋转角度, 使种 群能够具有比较好的全局搜索能力; 同时为了避免陷入局部最优, 本文对旋转后的概率幅进行了修正操作. 针对数据 聚类问题, 本文提出了一种基于改进量子旋转门的量子进化数据聚类方法. 仿真对比实验表明: 与采用常规的量子旋 转门的算法及一些其他的进化算法相比, 本文方法在聚类正确率上有了很大的
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:1048576
    • 提供者:weixin_38674627
  1. 基于距离最大化和缺失数据聚类的填充算法

  2. 通过对基于K-means聚类的缺失值填充算法的改进,文中提出了基于距离最大化和缺失数据聚类的填充算法。首先,针对原填充算法需要提前输入聚类个数这一缺点,设计了改进的K-means聚类算法:使用数据间的最大距离确定聚类中心,自动产生聚类个数,提高聚类效果;其次,对聚类的距离函数进行改进,采用部分距离度量方式,改进后的算法可以对含有缺失值的记录进行聚类,简化原填充算法步骤。通过对STUDENT ALCOHOL CONSUMPTION数据集的实验,结果证明了该算法能够在提高效率的同时,有效地填充缺失数
  3. 所属分类:其它

    • 发布日期:2021-01-28
    • 文件大小:1048576
    • 提供者:weixin_38727087
  1. 基于大数据聚类分析的电网信息化运维系统设计

  2. 针对决策树、SVM和神经网络3种算法下的电网信息化运维系统性能不足的问题,设计基于大数据聚类分析的电网信息化运维系统。该系统整体框架采用ExtJs+Spring+iBatis架构,硬件包括:感知集成芯片、数据传输设备、数据融合处理器、中央控制器、可视化设备。软件运行利用集成芯片将相关电网数据抽取出来,传输到数据融合处理器中,基于聚类分析算法从电网信息中发现异常信息,得到的检测结果通过可视化设备显示出来,实现电网信息化运维。实验结果表明,与传统系统相比,所设计系统由于迭代次数减少,占用系统内存减少
  3. 所属分类:其它

    • 发布日期:2021-01-12
    • 文件大小:1048576
    • 提供者:weixin_38599518
  1. 大数据聚类的具有随机投影的模糊c均值和聚类集成

  2. 大数据聚类的具有随机投影的模糊c均值和聚类集成
  3. 所属分类:其它

    • 发布日期:2021-03-31
    • 文件大小:2097152
    • 提供者:weixin_38686041
« 12 3 4 5 6 7 8 9 10 ... 31 »