您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于新的关键词提取方法的快速文本分类系统

  2. 关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度 考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法 (,-),并利用.,/0, 算法来筛选出关键词以完成将123 文档进行快速有效分类的目的。实验表明,该方法在不 影响分类准确率的情况下,分类的速度明显提高。
  3. 所属分类:其它

    • 发布日期:2009-08-10
    • 文件大小:116736
    • 提供者:taipinghai
  1. 一种基于主题词表的快速中文文本分类技术

  2. 一种基于主题词表的快速中文文本分类技术一种基于主题词表的快速中文文本分类技术一种基于主题词表的快速中文文本分类技术
  3. 所属分类:专业指导

    • 发布日期:2009-12-31
    • 文件大小:225280
    • 提供者:h15004694589
  1. 基于新的关键词提取方法的快速文本分类系统

  2. !) 文档中文信息的切词 1) 文档中文信息的切词 1.1新型机器词典的建立 1.2动词词典、虚词词典和停用词词典的建立依据 1.3基于“小容量”词库的切分技术 1.4三种切分的比对及相关规则的建立 2) 进一步过滤关键词:CD)ED 算法及其改进 3) kNN(k-Nearest-Neighbor)分类算法
  3. 所属分类:其它

    • 发布日期:2010-11-09
    • 文件大小:116736
    • 提供者:qdfch
  1. WordFeature文本分类器

  2. 实现的功能 一、语料库处理 词频率(TF),文档频率(DF)的统计。 二、特征词提取。 文档频率DF方法:DF大于指定的阀值而且在各分类之间具有差异性。 开方(χ2) 方法:衡量特征与类别的独立性 信息增益IG方法:衡量特征能够为分类系统带来多少信息,跟具体类别无关。 三、文本分类。 分类快速。 能对单个文件、目录、文件列表进行分类。
  3. 所属分类:专业指导

    • 发布日期:2010-12-18
    • 文件大小:1039360
    • 提供者:book100
  1. 一种快速高效的文本分类方法

  2. 一种快速高效的文本分类方法,一种快速高效的文本分类方法,一种快速高效的文本分类方法
  3. 所属分类:互联网

    • 发布日期:2011-04-18
    • 文件大小:149504
    • 提供者:sha1985123
  1. 基于关键词提取方法的快速文本分类系统

  2. 关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度 考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法 ( FS) ,并利用TFIDF算法来筛选出关键词以完成将Web文档进行快速有效分类的目的。实验表明,该方法在不 影响分类准确率的情况下,分类的速度明显提高。 关键词: 计算机应用; 中文信息处理; 关键词提取; Web文档分类
  3. 所属分类:其它

    • 发布日期:2011-07-08
    • 文件大小:196608
    • 提供者:vcd
  1. 机器学习的文本分类技术研究

  2. 基于机器学习的文本分类技术研究进展 快速了解文件分类技术
  3. 所属分类:Java

    • 发布日期:2013-05-15
    • 文件大小:430080
    • 提供者:zhaohaijun1986
  1. 文本分类在搜索引擎中的应用

  2. 搜索引擎检索结果的文档列表通常过于庞大,给用户逐个浏览寻找相关的结果带来极大不便。于是在当前搜索引擎的工作机制基础之上,本文提出在用户接口与检索器之间接入文本分类器,由它对检索结果自动地进行联机分类,以方便用户快速找到跟查询请求相关的文档。同时分析了文本分类器的主要技术问题,如:文本的特征表示、特征抽取、分类方法的选择等。
  3. 所属分类:Web开发

    • 发布日期:2015-04-21
    • 文件大小:845824
    • 提供者:sinat_27596541
  1. fastText:文本分类和词嵌入工具

  2. 快速文本分类,多文本分类, 词嵌入
  3. 所属分类:深度学习

    • 发布日期:2018-10-17
    • 文件大小:4194304
    • 提供者:m0_37963246
  1. 基于模糊支持向量机的文本分类

  2. 为了有效地利用信息技术发展而产生的海量信息,信息检索与数据挖掘得到了快速的发展,通过对传统支持向量机的特点分析,针对其在文本分类中的局限性,采用了一种基于二叉树的模糊支持向量机的多分类算法,通过实验证明该算法有更好的抗干扰能力和更好的分类效果。
  3. 所属分类:其它

    • 发布日期:2020-06-27
    • 文件大小:901120
    • 提供者:weixin_38665490
  1. 机器学习实战之朴素贝叶斯(二)文本分类

  2. 朴素贝叶斯(二)文本分类朴素贝叶斯的一般流程用python进行文本分类准备数据:从文本中构建词向量训练算法:从词向量计算概率测试算法:朴素贝叶斯分类函数文档词袋模型 朴素贝叶斯的一般流程 (1)收集数据:任何方法 (2)准备数据:数值型、布尔型 (3)分析数据:特征多,用直方图效果好 (4)训练算法:计算不同的独立特征的多条件概率 (5)测试算法:计算错误率 (6)使用算法:一般应用于文档分类,也可以在任意分类场景 用python进行文本分类 以在线社区留言板为例,构建快速过滤器,判断是否是侮辱
  3. 所属分类:其它

    • 发布日期:2020-12-20
    • 文件大小:50176
    • 提供者:weixin_38705723
  1. TextClf:简单易上手的基于pytorch/sklearn的文本分类工具

  2. 文本分类是自然语言处理中最常见的任务之一。从邮箱应用中的垃圾邮件识别到搜索引擎中的query意图判别, 再到商品评论中的情感分析, 这些其实都是我们身边对文本分类的常见需求。 为了帮助大家更好的应对经常遇到的文本分类场景,我最近开发了一个工具箱TextClf,使用TextClf, 你可以通过生成和修改配置文件,快速尝试多种分类算法模型、调整参数、搭建baseline, 有了这个工具箱,你可以从模型搭建、模型训练、模型测试等一系列复杂的实现中脱离出来, 让你能有更多精力关注于数据本身的特点,做针对
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:122880
    • 提供者:weixin_38671048
  1. 使用PyTorch建立你的第一个文本分类模型

  2. 概述 学习如何使用PyTorch执行文本分类 理解解决文本分类时所涉及的要点 学习使用包填充(Pack Padding)特性 介绍 我总是使用最先进的架构来在一些比赛提交模型结果。得益于PyTorch、Keras和TensorFlow等深度学习框架,实现最先进的体系结构变得非常容易。这些框架提供了一种简单的方法来实现复杂的模型体系结构和算法,而只需要很少的概念知识和代码技能。简而言之,它们是数据科学社区的一座金矿! 在本文中,我们将使用PyTorch,它以其快速的计算能力而闻名。因此,在本文中
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:166912
    • 提供者:weixin_38669091
  1. Disaster_Response_Text_classification:Udacity纳米度灾难响应文本分类项目。 此回购协议有助于将灾难期间收到的文本分类为适当的类别,以便相关部门Swift做出响应-源码

  2. 灾难响应管道项目-(文本分类器-Udacity纳米学位计划) 该项目的目标是对短信进行分类,以帮助应对灾害 ·· 灾害响应管道项目 该项目适用于Udacity纳米学位课程。 它将文本消息分类为36个不同的变量。 快速说明: 在项目的根目录中运行以下命令来设置数据库和模型。 运行ETL管道以清理数据并将其存储在数据库中python data/process_data.py data/disaster_messages.csv data/disaster_categories.csv data
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:3145728
    • 提供者:weixin_42151373
  1. chinese_text_classification:通过一个中文文本分类问题系统实现了各种分类方法-源码

  2. chinese_text_classification 通过一个中文文本分类问题系统实现了各种分类方法 数据来源 数据搜狗新闻 类别 有汽车,娱乐,军事,体育,技术五种类别。原始数据比较大,没有上传,分词,去除重组词之后的数据放在processed_data文件夹下。 分类算法 主要实现了以下分类算法: NB(朴素贝叶斯) 支持向量机 快速文本 text_CNN text_RNN text_RCNN text_Bi_LSTM text_Attention_Bi_LSTM HAN(分
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:6291456
    • 提供者:weixin_42116705
  1. TextClassification:使用不同神经网络的文本分类-源码

  2. 文字分类 使用不同的神经网络进行文本分类。中文文本分类,使用TensorFlow 2.x实现TextCNN,TextRNN,TextRCNN,BiLSTM Attention,HAN等类型的深度学习模型。 数据 数据收集数据只取新闻中的五个类别:汽车,娱乐,军事,体育,科技将五个类别分词后保存到数据文件目录,作为分类模型构造与验证数据。 数据集 数据量 总数据 87747 训练集 65810 测试集 21973 环境 的Python 3.7 TensorFlow 2.0+ 使用说明 进入到相关模
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:7340032
    • 提供者:weixin_42148975
  1. 与线性分类器和极限学习机协同工作以实现快速文本分类

  2. 与线性分类器和极限学习机协同工作以实现快速文本分类
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:841728
    • 提供者:weixin_38564598
  1. 基于Hadoop平台的海量文本分类的并行化

  2. 文本分类是信息检索与数据挖掘的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.近来年随着文本数据呈指数增长,要有效地管理这些数据,就必须在分布式环境下用有效的算法来处理这些数据.在Ha-doop分布式平台下实现了一简单有效的文本分类算法——TFIDF分类算法,即一种基于向量空间模型的分类算法,它用余弦相似度得到分类结果.在两个数据集上做了实验,结果表明,这一并行化算法在大数据集上很有效并可以在实际领域中得到良好的应用.
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:660480
    • 提供者:weixin_38727453
  1. keras-text:Keras中的文本分类库-源码

  2. Keras文本分类库 keras-text是一站式的文本分类库,可通过干净且可扩展的界面实现各种最新模型,以实现自定义架构。 快速开始 创建一个标记器以建立您的词汇表 要将您的数据集表示为(docs, words)使用WordTokenizer 要将您的数据集表示为(docs, sentences, words)使用SentenceWordTokenizer 要创建任意层次结构,请扩展Tokenizer并实现token_generator方法。 from keras_text . pro
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:11534336
    • 提供者:weixin_42110469
  1. 基于SVM的中文文本分类系统的设计与实现

  2. 互联网已经成为现代生活中不可或缺的一部分,网络上的信息量也在以数倍的速度快速增长。无论是企事业单位,学校,或者科研院校等等机构中,都积累了非常多的资料,这些资料绝大多数都以文档的形式存在。所以,如何将数以万计且排序混乱的文本信息,按照一定的规则和形式进行统一的管理,以达到方便使用和管理的目的成为了一个不得不去解决的问题。本文就是在SVM,即支持向量机方法的基础上,设计了一个中文文本分类系统。介绍了系统的需求分析,并对系统进行了详细设计,从概念的初始化设计到之后的详细设计,实现了基于SVM的中文文
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:731136
    • 提供者:weixin_38747025
« 12 3 4 5 6 7 8 9 10 ... 23 »