搜索资源 - 中文自动分类 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 中文自动分类

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

中文文本分类中特征抽取方法的比较研究.pdf
本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率 DF、信息增益 IG、互信息 MI、 χ2 分布 CHI四种不同的特征选取方法。采用支持向量机(SVM)和 KNN 两种不同的分类器以考察不同抽取方法的有效性。实验结果表明 ,在英文文本分类中表现良好的特征抽取方法( IG、 MI和 CHI)在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因 ,并分析了可能的矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特
所属分类：专业指导
- 发布日期：2009-12-06
- 文件大小：348160
- 提供者：shiyoumaomao

中文网页自动分类器
利用knn算法实现了一个中文网页自动分类器，包括网页预处理，ictclas中文分词，基于tf-idf的文本特征表示，基于df的特征选取和基于knn的分类算法，最后通过struts2框架web发布
所属分类：其它
- 发布日期：2007-11-26
- 文件大小：177152
- 提供者：Mars587

基于VSM的中文文本分类系统的设计与实现.pdf
摘　要: 文本分类是指在给定分类体系下, 根据文本的内容自动确定文本类别的过程。该文阐述了一个基于向量空间模型的中文文本分类系统的设计和实现。对文本分类系统的系统结构、预处理、特征提取、训练算法、分类算法等进行了详细介绍。引入标题权重系数改进词语权重, 并提出了一种新的分类算法。实验测试结果表明查全率和准确率均达到 90 %左右, 而且标题权重的引入和新分类算法的实施有效地改善了分类性能。
所属分类：其它
- 发布日期：2010-01-24
- 文件大小：263168
- 提供者：goodskyfly_1876

基于内容的中文网页自动分类研究
摘　要:本文主要介绍基于内容的网页自动分类系统,具体介绍了类别词典的建造方法, 网页超文本类别词切分的方法,中文网页自动分类算法以及利用类别词与网页间的模糊关系对网页文本进行自动分类等内容.通过对旅游网页进行测试, 自动分类正确率可达 93. 37 %以上,有效地提高了查准率和查全率.
所属分类：互联网
- 发布日期：2011-12-18
- 文件大小：212992
- 提供者：huangle86

中文网页自动分类器
中文网页自动分类器，，，，
所属分类：其它
- 发布日期：2008-06-01
- 文件大小：177152
- 提供者：charcle

基于本体进行自动分类的中文元搜索引擎结果优化方案
基于本体进行自动分类的中文元搜索引擎结果优化方案，毕业论文，元搜索引擎
所属分类：Web开发
- 发布日期：2012-02-19
- 文件大小：2097152
- 提供者：songtzu

中文文本自动分类方法的研究和实现
文档介绍了中文文本自动分类方法的研究和实现，在网络舆情监控的文本分类中有很重要的作用
所属分类：网络监控
- 发布日期：2012-04-11
- 文件大小：2097152
- 提供者：abclinlin2011

中文新闻信息自动分类标引的构想与实现
中文信息处理参考资料。自动分类就是用计算机系统代替人工按照一定的分类标准或者分类参考，对文献等对象进行分类，其任务是：在给定的分类体系下，根据文本的内容自动地确定文本关联的类别。
所属分类：其它
- 发布日期：2014-03-05
- 文件大小：67584
- 提供者：okread

中文网页自动分类技术
中文网页自动分类技术，学习了解中文网页的自动分类技术。
所属分类：其它
- 发布日期：2014-05-26
- 文件大小：722944
- 提供者：manybirds

基于svm的中文文本自动分类系统的语料库
基于svm的中文文本自动分类系统的语料库, 包含了17类，全部都是自己爬的. 详情：http://blog.csdn.net/yinchuandong2/article/details/17717449
所属分类：Java
- 发布日期：2014-07-23
- 文件大小：10485760
- 提供者：yinchuandong2

KNN和SVM算法在中文文本自动分类技术上的比较研究
KNN和SVM算法在中文文本自动分类技术上的比较研究
所属分类：C/C++
- 发布日期：2014-08-19
- 文件大小：294912
- 提供者：kris123456

中文新闻网页自动分类
基于《中文新闻信息分类与代码》，提出一种基于标题的自动分类方法。
所属分类：其它
- 发布日期：2014-11-25
- 文件大小：320512
- 提供者：happyfate

中文文本自动分类系统研究—汉语分词及分类器的设计
中文文本自动分类系统研究—汉语分词及分类器的设计
所属分类：C
- 发布日期：2015-01-05
- 文件大小：2097152
- 提供者：baibaibao

libsvm 中文文本分类语料库
libsvm 中文文本分类语料库自动分类
所属分类：Java
- 发布日期：2015-12-05
- 文件大小：10485760
- 提供者：u013606554

大规模中文网页的自动分类研究
大规模中文网页的自动分类研究 NH文件需要用CNKI® CAJViewer打开
所属分类：专业指导
- 发布日期：2009-02-03
- 文件大小：2097152
- 提供者：jhrxt

基于联合语义特征的中文问题分类
问题分类是自动问答系统中重要的研究内容。中文疑问句与长篇文章和那些简短的文章（例如对产品的评论）不同。它们通常包含疑问词，例如，谁，哪个，哪里或如何指定所需的信息，并且在句子中包括完整的语法组成部分。基于这些特征，本文提出了一种更有效的中文问题分类特征提取方法。我们首先提取句子的首部动词及其从属词与句子的疑问词相结合作为我们的基本特征。然后，我们使用潜在语义分析来帮助从基本特征中消除语义干扰。最后，通过加权词嵌入方法将这些特征扩展为语义表示特征。若干实验结果表明，我们的语义联合特征
所属分类：其它
- 发布日期：2021-03-15
- 文件大小：412672
- 提供者：weixin_38665775

一种基于逆向匹配算法的中文文本分类技术
针对中文文本的自动分类问题,提出了一种逆向匹配算法。该算法的基本思路是构造一个带权值的分类主题词表,然后用词表中的关键词在待分类的文档中进行逆向匹配,并统计匹配成功的权值和,以权值和最大者作为分类结果。本算法可以避开中文分词的难点和它对分类结果的影响。理论分析和实验结果表明,该技术分类结果的准确度和时间效率都比较高,其综合性能达到了目前主流技术的水平。
所属分类：其它
- 发布日期：2021-02-22
- 文件大小：261120
- 提供者：weixin_38522552

一种基于主题词表的快速中文文本分类技术
针对中文文本的自动分类问题,提出了一种新的算法。该算法的基本思路是构造一个带权值的分类主题词表,该词表采用键树的方式构建,然后利用哈希杂凑法和长词匹配优先原则在主题词表中匹配待分类的文档中的字符串,并统计匹配成功的权值和,以权值和最大者作为分类结果。本算法可以避开中文分词的难点和它对分类结果的影响。理论分析和实验结果表明,该技术分类结果的准确度和时间效率都比较高,其综合性能达到了目前主流技术的水平。
所属分类：其它
- 发布日期：2021-02-20
- 文件大小：521216
- 提供者：weixin_38519763

text-classification-cn：中文文本分类实践，基于搜狗新闻语料库，采用传统机器学习方法以及预训练模型等方法-源码
文字分类文本分类（文本分类）是自然语言处理中的一个重要应用技术，根据文档的内容或主题，自动识别文档所属的预先定义的类别标签。文本分类是很多应用场景的基础，某些垃圾邮件识别，舆情分析，情感识别，新闻自动分类，智能客服机器人的合并分类等等。此处分为两个部分：第1部分：基于scikit学习机器学习的Python库，对比几个传统机器学习方法的文本分类第2部分：基于预训练词向量模型，使用Keras工具进行文本分类，用到了CNN 本文语料：，密码：P9M4。更多新闻标注语料，。预训练词向量模型来自
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：212972
- 提供者：weixin_42101237

THUCTC：高效的中文文本分类器-源码
THUCTC：一个高效的中文文本分类工具目录项目介绍 THUCTC（THU中文文本分类）是由清华大学自然语言处理实验室推出的中文文本分类工具包，能够自动高效地实现用户自定义的文本分类语料的训练，评估，分类功能。，特征降维，分类模型学习三个步骤。如何选择合适的文本特征并进行降维，是中文文本分类的挑战性问题。我组根据多年在中文文本分类的研究经验，在THUCTC中选取二字串bigram作为特征单元，特征降维方法为卡方，权重计算方法为tfidf，分类模型使用的是LibSVM或LibLinear。T
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：1048576
- 提供者：weixin_42099942

« 12 3 4 5 6 7 8 9 10 ... 36 »