您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 中文文本分类中特征抽取方法的比较研究.pdf

  2. 本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率 DF、 信息增 益 IG、 互信息 MI、 χ2 分布 CHI四种不同的特征选取方法。采用支持向量机(SVM)和 KNN 两种不同的分类 器以考察不同抽取方法的有效性。实验结果表明 ,在英文文本分类中表现良好的特征抽取方法( IG、 MI和 CHI)在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因 ,并分析了可能的 矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特
  3. 所属分类:专业指导

    • 发布日期:2009-12-06
    • 文件大小:348160
    • 提供者:shiyoumaomao
  1. 中文网页自动分类器

  2. 利用knn算法实现了一个中文网页自动分类器, 包括网页预处理,ictclas中文分词,基于tf-idf的文本特征表示,基于df的特征选取和基于knn的分类算法,最后通过struts2框架web发布
  3. 所属分类:其它

    • 发布日期:2007-11-26
    • 文件大小:177152
    • 提供者:Mars587
  1. 基于VSM的中文文本分类系统的设计与实现.pdf

  2. 摘 要: 文本分类是指在给定分类体系下, 根据文本的内容 自动确定文本类别的过程。该文阐述了一个基于向量空间模 型的中文文本分类系统的设计和实现。对文本分类系统的系 统结构、预处理、特征提取、训练算法、分类算法等进行了详 细介绍。引入标题权重系数改进词语权重, 并提出了一种新 的分类算法。实验测试结果表明查全率和准确率均达到 90 %左右, 而且标题权重的引入和新分类算法的实施有效 地改善了分类性能。
  3. 所属分类:其它

    • 发布日期:2010-01-24
    • 文件大小:263168
    • 提供者:goodskyfly_1876
  1. 基于内容的中文网页自动分类研究

  2. 摘 要:本文主要介绍基于内容的网页自动分类系统,具体介绍了类别词典的建造方法, 网页超文本类别 词切分的方法,中文网页自动分类算法以及利用类别词与网页间的模糊关系对网页文本进行自动分类等内 容.通过对旅游网页进行测试, 自动分类正确率可达 93. 37 %以上,有效地提高了查准率和查全率.
  3. 所属分类:互联网

    • 发布日期:2011-12-18
    • 文件大小:212992
    • 提供者:huangle86
  1. 中文网页自动分类器

  2. 中文网页自动分类器,,,,
  3. 所属分类:其它

    • 发布日期:2008-06-01
    • 文件大小:177152
    • 提供者:charcle
  1. 基于本体进行自动分类的中文元搜索引擎结果优化方案

  2. 基于本体进行自动分类的中文元搜索引擎结果优化方案,毕业论文,元搜索引擎
  3. 所属分类:Web开发

    • 发布日期:2012-02-19
    • 文件大小:2097152
    • 提供者:songtzu
  1. 中文文本自动分类方法的研究和实现

  2. 文档介绍了中文文本自动分类方法的研究和实现,在网络舆情监控的文本分类中有很重要的作用
  3. 所属分类:网络监控

    • 发布日期:2012-04-11
    • 文件大小:2097152
    • 提供者:abclinlin2011
  1. 中文新闻信息自动分类标引的构想与实现

  2. 中文信息处理参考资料。 自动分类就是用计算机系统代替人工按照一定的分类标准或者分类参考,对文献等对象进行分类,其任务是:在给定的分类体系下,根据文本的内容自动地确定文本关联的类别。
  3. 所属分类:其它

    • 发布日期:2014-03-05
    • 文件大小:67584
    • 提供者:okread
  1. 中文网页自动分类技术

  2. 中文网页自动分类技术,学习了解中文网页的自动分类技术。
  3. 所属分类:其它

    • 发布日期:2014-05-26
    • 文件大小:722944
    • 提供者:manybirds
  1. 基于svm的中文文本自动分类系统的语料库

  2. 基于svm的中文文本自动分类系统的语料库, 包含了17类, 全部都是自己爬的. 详情:http://blog.csdn.net/yinchuandong2/article/details/17717449
  3. 所属分类:Java

    • 发布日期:2014-07-23
    • 文件大小:10485760
    • 提供者:yinchuandong2
  1. KNN和SVM算法在中文文本自动分类技术上的比较研究

  2. KNN和SVM算法在中文文本自动分类技术上的比较研究
  3. 所属分类:C/C++

    • 发布日期:2014-08-19
    • 文件大小:294912
    • 提供者:kris123456
  1. 中文新闻网页自动分类

  2. 基于《中文新闻信息分类与代码》,提出一种基于标题的自动分类方法。
  3. 所属分类:其它

    • 发布日期:2014-11-25
    • 文件大小:320512
    • 提供者:happyfate
  1. 中文文本自动分类系统研究—汉语分词及分类器的设计

  2. 中文文本自动分类系统研究—汉语分词及分类器的设计
  3. 所属分类:C

    • 发布日期:2015-01-05
    • 文件大小:2097152
    • 提供者:baibaibao
  1. libsvm 中文文本分类 语料库

  2. libsvm 中文文本分类 语料库 自动分类
  3. 所属分类:Java

    • 发布日期:2015-12-05
    • 文件大小:10485760
    • 提供者:u013606554
  1. 大规模中文网页的自动分类研究

  2. 大规模中文网页的自动分类研究 NH文件需要用CNKI® CAJViewer打开
  3. 所属分类:专业指导

    • 发布日期:2009-02-03
    • 文件大小:2097152
    • 提供者:jhrxt
  1. 基于联合语义特征的中文问题分类

  2. 问题分类是自动问答系统中重要的研究内容。 中文疑问句与长篇文章和那些简短的文章(例如对产品的评论)不同。 它们通常包含疑问词,例如,谁,哪个,哪里或如何指定所需的信息,并且在句子中包括完整的语法组成部分。 基于这些特征,本文提出了一种更有效的中文问题分类特征提取方法。 我们首先提取句子的首部动词及其从属词与句子的疑问词相结合作为我们的基本特征。 然后,我们使用潜在语义分析来帮助从基本特征中消除语义干扰。 最后,通过加权词嵌入方法将这些特征扩展为语义表示特征。 若干实验结果表明,我们的语义联合特征
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:412672
    • 提供者:weixin_38665775
  1. 一种基于逆向匹配算法的中文文本分类技术

  2. 针对中文文本的自动分类问题,提出了一种逆向匹配算法。该算法的基本思路是构造一个带权值的分类主题词表,然后用词表中的关键词在待分类的文档中进行逆向匹配,并统计匹配成功的权值和,以权值和最大者作为分类结果。本算法可以避开中文分词的难点和它对分类结果的影响。理论分析和实验结果表明,该技术分类结果的准确度和时间效率都比较高,其综合性能达到了目前主流技术的水平。
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:261120
    • 提供者:weixin_38522552
  1. 一种基于主题词表的快速中文文本分类技术

  2. 针对中文文本的自动分类问题,提出了一种新的算法。该算法的基本思路是构造一个带权值的分类主题词表,该词表采用键树的方式构建,然后利用哈希杂凑法和长词匹配优先原则在主题词表中匹配待分类的文档中的字符串,并统计匹配成功的权值和,以权值和最大者作为分类结果。本算法可以避开中文分词的难点和它对分类结果的影响。理论分析和实验结果表明,该技术分类结果的准确度和时间效率都比较高,其综合性能达到了目前主流技术的水平。
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:521216
    • 提供者:weixin_38519763
  1. text-classification-cn:中文文本分类实践,基于搜狗新闻语料库,采用传统机器学习方法以及预训练模型等方法-源码

  2. 文字分类 文本分类(文本分类)是自然语言处理中的一个重要应用技术,根据文档的内容或主题,自动识别文档所属的预先定义的类别标签。文本分类是很多应用场景的基础,某些垃圾邮件识别,舆情分析,情感识别,新闻自动分类,智能客服机器人的合并分类等等。此处分为两个部分: 第1部分:基于scikit学习机器学习的Python库,对比几个传统机器学习方法的文本分类 第2部分:基于预训练词向量模型,使用Keras工具进行文本分类,用到了CNN 本文语料:,密码:P9M4。更多新闻标注语料,。 预训练词向量模型来自
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:212972
    • 提供者:weixin_42101237
  1. THUCTC:高效的中文文本分类器-源码

  2. THUCTC:一个高效的中文文本分类工具 目录 项目介绍 THUCTC(THU中文文本分类)是由清华大学自然语言处理实验室推出的中文文本分类工具包,能够自动高效地实现用户自定义的文本分类语料的训练,评估,分类功能。 ,特征降维,分类模型学习三个步骤。如何选择合适的文本特征并进行降维,是中文文本分类的挑战性问题。我组根据多年在中文文本分类的研究经验,在THUCTC中选取二字串bigram作为特征单元,特征降维方法为卡方,权重计算方法为tfidf,分类模型使用的是LibSVM或LibLinear。T
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:1048576
    • 提供者:weixin_42099942
« 12 3 4 5 6 7 8 9 10 ... 36 »