您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 用于文本分类和文本聚类的特征抽取方法的研究

  2. 文本分类和聚类技术展开了研究,分析了特征抽取法在文本分类和文本聚类中应用的重要性,以及论证了为何要对文本进行特征抽取,最后分别阐述了用于文本分类和文本聚类的特征抽取方法。
  3. 所属分类:专业指导

    • 发布日期:2009-06-26
    • 文件大小:160768
    • 提供者:jacy0627
  1. 中文文本分类中特征抽取方法的比较研究.pdf

  2. 本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率 DF、 信息增 益 IG、 互信息 MI、 χ2 分布 CHI四种不同的特征选取方法。采用支持向量机(SVM)和 KNN 两种不同的分类 器以考察不同抽取方法的有效性。实验结果表明 ,在英文文本分类中表现良好的特征抽取方法( IG、 MI和 CHI)在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因 ,并分析了可能的 矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特
  3. 所属分类:专业指导

    • 发布日期:2009-12-06
    • 文件大小:348160
    • 提供者:shiyoumaomao
  1. 中文文本分类中特征抽取方法的比较研究

  2. 本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增益IG、互信息MI、V2 分布CHI 四种不同的特征选取方法。采用支持向量机(SVM) 和KNN 两种不同的分类器以考察不同抽取方法的有效性。实验结果表明, 在英文文本分类中表现良好的特征抽取方法( IG、MI 和CHI) 在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因, 并分析了可能的矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特征抽取方法的有效性
  3. 所属分类:专业指导

    • 发布日期:2010-09-02
    • 文件大小:244736
    • 提供者:guofeng314
  1. 文本分类中特征抽取方法的比较研究

  2. 一篇个人觉得写得不错的参考文献 文本分类中特征抽取方法的比较研究.pdf 外加特征选择实现DF方法JAVA源代码 源码下载地址:http://download.csdn.net/source/2827063 要求先分好词 代码中有详细的注释
  3. 所属分类:Java

    • 发布日期:2010-11-12
    • 文件大小:540672
    • 提供者:ben10303050
  1. 文本挖掘tmSVM开源项目包含Python和Java两种版本带参考文档

  2. 文本挖掘tmSVM开源项目集成libSVM和liblinear包含Python和Java两种版本带PDF源码参考文档 简介 文本挖掘无论在学术界还是在工业界都有很广泛的应用场景。而文本分类是文本挖掘中一个非常重要的手段与技术。现有的分类技术都已经非常成熟,SVM、KNN、Decision Tree、AN、NB在不同的应用中都展示出较好的效果,前人也在将这些分类算法应用于文本分类中做出许多出色的工作。但在实际的商业应用中,仍然有很多问题没有很好的解决,比如文本分类中的高维性和稀疏性、类别的不平衡
  3. 所属分类:Python

    • 发布日期:2014-02-23
    • 文件大小:3145728
    • 提供者:vcfriend
  1. 分本分类特征抽取

  2. 中文文本分类中特征抽取方法的比较研究 :计算机应用;中文信息处理;文本自动分类;特征抽取;支持向量机;
  3. 所属分类:互联网

    • 发布日期:2014-04-28
    • 文件大小:712704
    • 提供者:obliviousdog
  1. 文本挖掘技术

  2. 第一章:引言 第二章:文本特征提取技术 第三章:文本检索技术 第四章:文本自动分类技术 第五章:文本自动聚类技术 第六章:话题检测跟踪技术 第七章:文本过滤技术 第八章:关联分析技术 第九章:文档自动摘要技术 第十章:信息抽取 第十一章:智能问答(QA)技术 第十二章:文本情感分析技术 第十三章:Ontology 第十四章:半结构化文本挖掘方法 第十五章:文本挖掘工具与应用
  3. 所属分类:其它

    • 发布日期:2014-07-25
    • 文件大小:12582912
    • 提供者:mashu999
  1. 最新版tmsvm_for_win_1.2.0文本分类Python和Java两种版本带参考文档

  2. 该系统在封装 libsvm 、 liblinear 的基础上,又增加了 特征选择 、 LSA特征抽取 、 SVM模型参数选择 、 libsvm格式转化模块 以及一些实用的工具。
  3. 所属分类:Python

    • 发布日期:2015-01-05
    • 文件大小:3145728
    • 提供者:kailun0315
  1. 文本分类在搜索引擎中的应用

  2. 搜索引擎检索结果的文档列表通常过于庞大,给用户逐个浏览寻找相关的结果带来极大不便。于是在当前搜索引擎的工作机制基础之上,本文提出在用户接口与检索器之间接入文本分类器,由它对检索结果自动地进行联机分类,以方便用户快速找到跟查询请求相关的文档。同时分析了文本分类器的主要技术问题,如:文本的特征表示、特征抽取、分类方法的选择等。
  3. 所属分类:Web开发

    • 发布日期:2015-04-21
    • 文件大小:845824
    • 提供者:sinat_27596541
  1. 关于文本特征抽取新方法的研究.pdf

  2. 该文研究了已有和最新的各种基于评估函数的特征筛选方法, 评价了它们的优缺点和适用范围, 并实现了一种用评估函数代替TFIDF 法中IDF 函数进行分类的新算法。然后进一步从如何放宽特征独立性假设, 利用等级关系的角度探讨了对特征筛选可能的改善。
  3. 所属分类:其它

    • 发布日期:2008-12-31
    • 文件大小:287744
    • 提供者:hg8956
  1. 基于后缀树模型的文本实时分类系统的研究和实现

  2. 本文在面向网络内容分析的前提下,提出了一种基于后缀树的文本向量空间模型(VSM),并在此 模型之上实现了文本分类系统。对比基于词的VSM,该模型利用后缀树的快速匹配,实时获得文本的向量 表示,不需要对文本进行分词、特征抽取等复杂计算。同时,该模型能够保证训练集中文本的更改,对分 类结果产生实时影响。实验结果和算法分析表明,我们系统的文本预处理的时间复杂度为O(N),远远优于 分词系统的预处理时间复杂度。此外,由于不需要分词和特征抽取,分类过程与具体语种无关,所以是一 种独立语种的分类方法
  3. 所属分类:网络基础

    • 发布日期:2009-02-22
    • 文件大小:228352
    • 提供者:blacfun
  1. 手把手教你做文本挖掘 课件

  2. 文本数据挖掘(Text Mining)是指从文本数据中抽取有价值的信息和知识的计算机处理技术。顾名思义,文本数据挖掘是从文本中进行数据挖掘(Data Mining)。从这个意义上讲,文本数据挖掘是数据挖掘的一个分支。 文本分析是指对文本的表示及其特征项的选取;文本分析是文本挖掘、信息检索的一个基本问题,它把从文本中抽取出的特征词进行量化来表示文本信息。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-05-10
    • 文件大小:944128
    • 提供者:jerry_qqxxw
  1. 文本挖掘技术

  2. 第一章:引言 第二章:文本特征提取技术 第三章:文本检索技术 第四章:文本自动分类技术 第五章:文本自动聚类技术 第六章:话题检测跟踪技术 第七章:文本过滤技术 第八章:关联分析技术 第九章:文档自动摘要技术 第十章:信息抽取 第十一章:智能问答(QA)技术 第十二章:文本情感分析技术 第十三章:Ontology 第十四章:半结构化文本挖掘方法 第十五章:文本挖掘工具与应用
  3. 所属分类:其它

    • 发布日期:2018-08-10
    • 文件大小:12582912
    • 提供者:qq_38327551
  1. 一种不良文本特征选择方法

  2. 文本的表示及其特征项的选取是信息检索的一个基本问 题, 它把从文本中抽取出的特征词进行量化来表示文本信息。
  3. 所属分类:专业指导

    • 发布日期:2010-10-21
    • 文件大小:575488
    • 提供者:kdj_kdj
  1. 深度学习实体关系抽取研究综述

  2. 实体关系抽取作为信息抽取、自然语言理解、信息检索等领域的核心任务和重要环节,能够从文本中抽取实体对间的语义关系.近年来,深度学习在联合学习、远程监督等方面上的应用,使关系抽取任务取得了较为丰富的研究成果.目前,基于深度学习的实体关系抽取技术,在特征提取的深度和模型的精确度上已经逐渐超过了传统基于特征和核函数的方法.围绕有监督和远程监督两个领域,系统总结了近几年来中外学者基于深度学习的实体关系抽取研究进展,并对未来可能的研究方向进行了探讨和展望.
  3. 所属分类:深度学习

    • 发布日期:2020-06-23
    • 文件大小:1048576
    • 提供者:kamo54
  1. 文本检索结果聚类及类别标签抽取技术研究.caj

  2. 本文根据检索结果聚类特点进行语义特征信息抽取来辅助聚类过程。着眼 于深度挖掘文本之间语义联系,提出基于语义空间转换方法的类别标签自动发 现算法。针对检索结果聚类的实用特性,力图保持检索结果聚类的时效性、准 确性和覆盖性,重点研究了以下问题: 1、基于语义特征抽取的初始信息优化选择 检索结果聚类需要直接呈现给用户,这一特点决定了传统的机器学习算法并 不能完美解决这一问题。理解文本的语义是自然语言处理的终极目标,同样对 于检索结果聚类是十分重要的。针对中文语义分析并不成熟的现状,本文提出 从网络
  3. 所属分类:深度学习

    • 发布日期:2020-09-08
    • 文件大小:4194304
    • 提供者:fengliren
  1. Python文本特征抽取与向量化算法学习

  2. 主要为大家详细介绍了Python文本特征抽取与向量化算法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
  3. 所属分类:其它

    • 发布日期:2020-09-20
    • 文件大小:100352
    • 提供者:weixin_38659789
  1. 面向用户话题相似性特征的链路预测方法

  2. 针对线上用户间的链路预测对用户文本内容特征的挖掘不够充分的现象,提出了面向用户兴趣话题相似性的二次特征抽取方法。该方法应用题模型得到任意用 户的主题分布,利用用户在主题上相异的分布比例提取各自的兴话题集合,基于兴趣话题集合构造了一 组话题相似性特征用于链路预测。不同于传统方法中 用户主题分布的直接利用,该方法对用户文本内容的相似性特征进行了再次挖掘,使得文本特征具有等同于结构特征的预测能力,并能够作为结构预测特征的有效补充。实验结果表明,内容特征的独立预测效果普遍优于结构特征,并且在联合预测中将
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:649216
    • 提供者:weixin_38703123
  1. 分块主成分分析在文本特征抽取中的应用

  2. 分块主成分分析在文本特征抽取中的应用
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:277504
    • 提供者:weixin_38593738
  1. Python文本特征抽取与向量化算法学习

  2. 本文为大家分享了Python文本特征抽取与向量化的具体代码,供大家参考,具体内容如下 假设我们刚看完诺兰的大片《星际穿越》,设想如何让机器来自动分析各位观众对电影的评价到底是“赞”(positive)还是“踩”(negative)呢? 这类问题就属于情感分析问题。这类问题处理的第一步,就是将文本转换为特征。 因此,这章我们只学习第一步,如何从文本中抽取特征,并将其向量化。 由于中文的处理涉及到分词问题,本文用一个简单的例子来说明如何使用Python的机器学习库,对英文进行特征提取。 1、
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:101376
    • 提供者:weixin_38738830
« 12 3 4 5 6 »