您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. kmeans中文文本聚类java源码(包括对文本tf,idf的计算,文本相似度计算)

  2. 算法思想:提取文档的TF/IDF权重,然后用余弦定理计算两个多维向量的距离来计算两篇文档的相似度,用标准的k-means算法就可以实现文本聚类。源码为java实现
  3. 所属分类:其它

    • 发布日期:2009-05-08
    • 文件大小:9216
    • 提供者:kaiyan0308
  1. 文档聚类在搜索引擎结果中的应用研究

  2. 一篇关于搜索引擎的论文,来自CNKI!
  3. 所属分类:其它

    • 发布日期:2007-11-04
    • 文件大小:3145728
    • 提供者:ZCH611407
  1. WEB挖掘文档聚类WEB挖掘文档聚类

  2. web挖掘中很重要的一个环节,进行文档聚类处理。
  3. 所属分类:Web开发

    • 发布日期:2009-11-23
    • 文件大小:425984
    • 提供者:yilinpang
  1. 改进性文本聚类资源研究

  2. 经典的文本聚类算法很多,K均值聚类算法是目前比较流行的一种基于划分的算法。该算法中文档 相似度计算通常采用向量空间模型,它们在假设术语间相互独立的基础上,通过逻辑表达式或向量间的 内积反映用户查询和文档的相似度,将查询结果按相似度的降序排列后提供给用户[1]。它们对用户的查 询项进行精确匹配,因此只能反映用户所要检索内容的某一方面,无法保证语义概念上的匹配。而且算法 效果与样本输入的次序和词频相关,只有当句子包含的词数足够多时,相关的词才会重复出现,其效果才 能体现出来,因此该算法只适合于词频
  3. 所属分类:其它

    • 发布日期:2010-05-17
    • 文件大小:190464
    • 提供者:nanaliv
  1. 文档聚类的英文文章A new hybridized approach of PSO GA for document clustering

  2. A new hybridized approach of PSO GA for document clustering
  3. 所属分类:Java

    • 发布日期:2010-07-26
    • 文件大小:413696
    • 提供者:jianli123
  1. web文档聚类的可视化实现

  2. 使用java Swing实现的web文档聚类可视化软件,输入网址,就可以自动对新闻内容进行解析,并对web文档进行聚类,改进了几种传统聚类算法的精度和权值计算方法,提高了的可靠性,为开发搜索引擎奠定了基础。
  3. 所属分类:Java

    • 发布日期:2011-05-21
    • 文件大小:2097152
    • 提供者:bbycszh
  1. Web挖掘中的XML文档聚类研究.pdf

  2. Web挖掘中的XML文档聚类研究.pdfWeb挖掘中的XML文档聚类研究.pdfWeb挖掘中的XML文档聚类研究.pdf
  3. 所属分类:Web开发

    • 发布日期:2011-07-25
    • 文件大小:2097152
    • 提供者:q345852047
  1. 基于密度方法的XML文档聚类研究

  2. 本文提出一种新的基于DBSCAN的结构相似性聚类算法,其可以用来发现非规则的,任意形状的聚类类型。同时,针对XML文档集所具备的“结构嵌套”的特性进行研究,本文还提出了一种新的XML分层语义聚类方法,将关键词所处的层级位置作为一个重要因素实现一种新的语义聚类算法,同时在语义比较时进行模糊而不是完全匹配,利用该方法相比传统的文档聚类技术可以更加有效地在语义层面对XML进行聚类。
  3. 所属分类:数据库

    • 发布日期:2011-12-22
    • 文件大小:2097152
    • 提供者:yuanygb
  1. 基于量子遗传算法的XML聚类集成

  2. 为了改善单一聚类算法的聚类性能,提出一种基于量子遗传算法的XML文档聚类集成解决方法。该方法先利用kNN分类划分k个差异性的聚类成员;其次根据聚类成员的关系获得的内联相似度矩阵,并通过多次分割、向下、向上、双向收缩的QR算法分解特征值对应的特征向量来实现矩阵的维数缩减;然后在映射空间上,用初始聚类中心构造量子遗传算法的初始种群,用量子遗传算法来寻找样本集的最优聚类组合,把每一个样本判别到最优的聚类类别中,从而完成聚类集成。为了验证本文提出的算法,实验结果显示,该聚类集成算法比单聚类算法具有更好
  3. 所属分类:其它

    • 发布日期:2011-12-26
    • 文件大小:331776
    • 提供者:hunanjjyy
  1. 文档聚类在Web搜索结果中的应用研究.kdh

  2. 文档聚类在Web搜索结果中的应用研究,讲解聚类算法的实际应用
  3. 所属分类:Web开发

    • 发布日期:2008-10-30
    • 文件大小:182272
    • 提供者:jenny3966
  1. 文档聚类源码包含原数据

  2. 文档聚类完整项目,虽然是ipynb但是可以转到python,还有实现结果图
  3. 所属分类:机器学习

    • 发布日期:2017-10-08
    • 文件大小:3145728
    • 提供者:qq_33686272
  1. 基于STC的中文文本聚类算法

  2. 提出了一种文档聚类方法,对用户的检索结果中类似的文档进行聚类,提供目录结 构,辅助用户浏览检索结果.首先分析了现有的文本聚类方法,讨论了它们的优势和不足,然后 提 出了 基 于后缓树的中文文本聚类算法,并详细描述了该算法的原理和构造使用过程,及在算 法 实现 的 过程中遇到的关键问题及解决方案
  3. 所属分类:其它

    • 发布日期:2009-04-15
    • 文件大小:434176
    • 提供者:terminator314
  1. python 文档聚类功能

  2. python 文档聚类功能 python 文档聚类功能 python 文档聚类功能
  3. 所属分类:深度学习

    • 发布日期:2018-07-08
    • 文件大小:14336
    • 提供者:kkk_ttt_0001
  1. 用于Web文档聚类的基于相似度的软聚类算法

  2. 用于Web文档聚类的基于相似度的软聚类算法,姜亚莉,关泽群,Internet的发展为人们提供了大量的信息资源,Web文本挖掘是从非结构化的文本中发现潜在的有价值的知识的一种有效技术,Web文本聚类能�
  3. 所属分类:其它

    • 发布日期:2020-02-01
    • 文件大小:128000
    • 提供者:weixin_38640242
  1. Web文档聚类中k-means算法的改进

  2. 介绍了Web文档聚类中普遍使用的、基于分割的k-means算法,分析了k-means算法所使用的向量空间模型和基于距离的相似性度量的局限性,从而提出了一种改善向量空间模型以及相似性度量的方法。
  3. 所属分类:其它

    • 发布日期:2020-10-26
    • 文件大小:198656
    • 提供者:weixin_38715567
  1. 通过具有实例级别约束的主动学习进行有效的半监督文档聚类

  2. 半监督文档聚类,考虑到有限的监督数据将未标记文档分组为聚类,最近引起了人们的极大兴趣。 由于获取监管数据可能会很昂贵,因此获取最丰富的信息以提高群集性能非常重要。 本文提出了一种半监督文档聚类算法和一种主动选择信息性实例级约束以提高聚类性能的新方法。 半监督文档聚类算法是约束DBSCAN(Cons-DBSCAN)算法,该算法结合了实例级约束来指导DBSCAN中的聚类过程。 提出了一种主动学习方法来选择信息性文档对,以获得用户反馈。 实验结果表明,在给定相对较少的约束条件下,Cons-DBSCAN
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:861184
    • 提供者:weixin_38742532
  1. 具有双重约束的半监督文档聚类的非负矩阵分解框架

  2. 在本文中,我们提出了一种新的半监督共聚算法正交半监督非负矩阵分解(OSS-NMF)用于文档聚类。 在这种新方法中,通过将成对约束形式的数据点(文档)的现有领域知识和特征(单词)的类别知识合并到NMF共聚框架中,从而实现了聚类过程。 在这种框架下,考虑到对偶先验知识,将聚类问题表述为寻找目标函数的局部极小值的问题。 导出更新规则,并为协同聚类过程设计了一种迭代算法。 从理论上讲,我们证明了算法的正确性和收敛性,并证明了其数学上的严格性。 我们的实验评估表明,提出的文档聚类模型在这些约束条件下表现出
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:1048576
    • 提供者:weixin_38638312
  1. 跨语言文档聚类中具有统计词义的文档表示

  2. 跨语言文档聚类中具有统计词义的文档表示
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:1048576
    • 提供者:weixin_38608025
  1. 用于文档聚类的半监督概念分解

  2. 用于文档聚类的半监督概念分解
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:483328
    • 提供者:weixin_38641876
  1. 主题建模:如何通过Laten Dirichlet分配(LDA)将文档聚类-源码

  2. 主题建模 如何通过Laten Dirichlet分配(LDA)对文档进行聚类
  3. 所属分类:其它

    • 发布日期:2021-02-16
    • 文件大小:7168
    • 提供者:weixin_42109732
« 12 3 4 5 6 7 8 9 10 ... 18 »