您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于新的关键词提取方法的快速文本分类系统

  2. 关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度 考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法 (,-),并利用.,/0, 算法来筛选出关键词以完成将123 文档进行快速有效分类的目的。实验表明,该方法在不 影响分类准确率的情况下,分类的速度明显提高。
  3. 所属分类:其它

    • 发布日期:2009-08-10
    • 文件大小:116736
    • 提供者:taipinghai
  1. 一种基于主题词表的快速中文文本分类技术

  2. 一种基于主题词表的快速中文文本分类技术一种基于主题词表的快速中文文本分类技术一种基于主题词表的快速中文文本分类技术
  3. 所属分类:专业指导

    • 发布日期:2009-12-31
    • 文件大小:225280
    • 提供者:h15004694589
  1. 基于新的关键词提取方法的快速文本分类系统

  2. !) 文档中文信息的切词 1) 文档中文信息的切词 1.1新型机器词典的建立 1.2动词词典、虚词词典和停用词词典的建立依据 1.3基于“小容量”词库的切分技术 1.4三种切分的比对及相关规则的建立 2) 进一步过滤关键词:CD)ED 算法及其改进 3) kNN(k-Nearest-Neighbor)分类算法
  3. 所属分类:其它

    • 发布日期:2010-11-09
    • 文件大小:116736
    • 提供者:qdfch
  1. WordFeature文本分类器

  2. 实现的功能 一、语料库处理 词频率(TF),文档频率(DF)的统计。 二、特征词提取。 文档频率DF方法:DF大于指定的阀值而且在各分类之间具有差异性。 开方(χ2) 方法:衡量特征与类别的独立性 信息增益IG方法:衡量特征能够为分类系统带来多少信息,跟具体类别无关。 三、文本分类。 分类快速。 能对单个文件、目录、文件列表进行分类。
  3. 所属分类:专业指导

    • 发布日期:2010-12-18
    • 文件大小:1039360
    • 提供者:book100
  1. 一种快速高效的文本分类方法

  2. 一种快速高效的文本分类方法,一种快速高效的文本分类方法,一种快速高效的文本分类方法
  3. 所属分类:互联网

    • 发布日期:2011-04-18
    • 文件大小:149504
    • 提供者:sha1985123
  1. 有效特征值提取的快速中文文本分类

  2. 基于有效特征值提取的快速中文文本分类,详细介绍了有效特征值的提取方法,实例!
  3. 所属分类:其它

    • 发布日期:2011-05-25
    • 文件大小:1048576
    • 提供者:vison1027
  1. 基于关键词提取方法的快速文本分类系统

  2. 关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度 考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法 ( FS) ,并利用TFIDF算法来筛选出关键词以完成将Web文档进行快速有效分类的目的。实验表明,该方法在不 影响分类准确率的情况下,分类的速度明显提高。 关键词: 计算机应用; 中文信息处理; 关键词提取; Web文档分类
  3. 所属分类:其它

    • 发布日期:2011-07-08
    • 文件大小:196608
    • 提供者:vcd
  1. 贝叶斯算法实现文本分类器

  2. 该文本详细的介绍了采用贝叶斯算法对文本进行分类,帮助大家快速入门,简洁明了。
  3. 所属分类:专业指导

    • 发布日期:2011-12-16
    • 文件大小:744448
    • 提供者:suyuan6634
  1. 基于汉明距离的文本相似度计算

  2. 传统的文本分类中相似度的计算, 是根据欧氏空间中向量之间夹角的余弦值来表征的, 它根据余弦值的大小来 反映文本之间的相互关系。该文则首先建立文本集与码字集之间的 #.# 对应关系,然后借用编码理论中汉明距离的概 念, 由汉明距离的计算公式, 得到了一种全新的文本相似度的计算方法, 与传统的方法相比较, 它具有简便, 快速等优点。
  3. 所属分类:IT管理

    • 发布日期:2012-01-19
    • 文件大小:100352
    • 提供者:gongdy
  1. Web文本挖掘技术研究

  2. 作为从浩瀚的Web信息资源中发现潜在的、有价值知识的一种有效技术, Web挖掘正悄然兴起, 倍受关注. 目前, Web挖掘的研究正处于发展阶段, 尚无统一的结论,需要国内外学者在理论上开展更多的讨论. 同时,Web挖掘系统的开发对其研究也将起到很大推进作用. 首先探讨了Web挖掘的有关理论, 从Web挖掘的定义、Web挖掘与Web信息检索的关系、Web挖掘任务的分类与功能等方面加以阐述. 然后重点分析了Web文本挖掘的方法, 包括: 文本的特征表示、文本分类与文本聚类. 在此基础上简单介绍了一
  3. 所属分类:网络安全

    • 发布日期:2012-04-05
    • 文件大小:252928
    • 提供者:bbs271
  1. 基于文本的数据挖掘

  2. 对数据的分类问题是人类所面临的一个非常重要且具有普遍意义的问题。将事物正确的分类,有助于人们认识世界,使杂乱无章的现实世界变得有条理。因此在科学技术、工农业生产以及工商业领域,数据分类、文本分类都起着至关重要的作用,例如人类基因序列的识别、电子商务、图书的分类、搜索引擎、动植物的分类等。同时,随着计算机技术的飞速发展,人们现在可以利用计算机自动的或者辅以少量的人工帮助,对大量的数据进行快速、准确的分类,人们称这种自动(半自动)的分类方法为分类器。近年来,随着Internet 的迅猛发展以及人们
  3. 所属分类:电子商务

    • 发布日期:2012-04-09
    • 文件大小:3145728
    • 提供者:ljz2885
  1. c5.0分类算法

  2. 实际应用的文本分类算法,能有效实现快速,准确的分类
  3. 所属分类:C++

    • 发布日期:2012-07-24
    • 文件大小:75776
    • 提供者:huhuayouxu
  1. Excel表格的35招必学秘技(快速成为高手).doc

  2. Excel表格的35招必学秘技(快速成为高手).doc Excel表格的35招必学秘技,必看! 也许你已经在Excel中完成过上百张财务报表,也许你已利用Excel函数实现过上千次的复杂运算,也许你认为Excel也不过如此,甚至了无新意。但我们平日里无数次重复的得心应手的使用方法只不过是Excel全部技巧的百分之一。本专题从Excel中的一些鲜为人知的技巧入手,领略一下关于Excel的别样风情。 一、让不同类型数据用不同颜色显示   在工资表中,如果想让大于等于2000元的工资总额以“红色”显
  3. 所属分类:专业指导

    • 发布日期:2012-12-15
    • 文件大小:183296
    • 提供者:wangyu519
  1. CrazyWords单词分类工具V1.0

  2. CrazyWords单词分类工具V1.0.exe 特别献给背不完单词书的人!!! 使用说明: 1、middle.txt中内置了2013年考研英语大纲词汇; 2、单词可在左中右三个列表框之间移动,三个列表框分别对应Left.txt,Middle.txt,Right.txt三个文本文件,当点击导出按钮时列表框数据将会同步到相应文本文件中; 3、程序在开始运行时会对单词数据进行检查,如果有重复的单词,将自动对其加上编号; 4、你可以对单词数据进行修改,前提是要确保单词与解释之间至少用一个空格隔开,且
  3. 所属分类:C++

    • 发布日期:2013-04-06
    • 文件大小:826368
    • 提供者:lofer8414
  1. 文本类型自动分类

  2. 网络新闻比传统纸质媒体新闻速度更快、内容更丰富、形式更灵活生动,正逐渐取代传统新闻媒体成为很多人获取新闻信息的主要途径。然而,面对快速更新的大量新闻信息,传统的手工分类方式无法满足用户的需求。新闻的主要内容一般都是以文本的方式呈现,因此,利用文本自动分类技术对网络新闻进行自动分类是解决手工新闻分类的一个有效途径。 本代码是利用python语言完成文本自动文类。
  3. 所属分类:互联网

    • 发布日期:2016-06-30
    • 文件大小:8192
    • 提供者:kings802
  1. 基于后缀树模型的文本实时分类系统的研究和实现

  2. 本文在面向网络内容分析的前提下,提出了一种基于后缀树的文本向量空间模型(VSM),并在此 模型之上实现了文本分类系统。对比基于词的VSM,该模型利用后缀树的快速匹配,实时获得文本的向量 表示,不需要对文本进行分词、特征抽取等复杂计算。同时,该模型能够保证训练集中文本的更改,对分 类结果产生实时影响。实验结果和算法分析表明,我们系统的文本预处理的时间复杂度为O(N),远远优于 分词系统的预处理时间复杂度。此外,由于不需要分词和特征抽取,分类过程与具体语种无关,所以是一 种独立语种的分类方法
  3. 所属分类:网络基础

    • 发布日期:2009-02-22
    • 文件大小:228352
    • 提供者:blacfun
  1. 文本快速分割器.exe

  2. 用于快速分割文本内容,,分类,整理文本,分出自己想要的内容!! 个人文本分离器,快速整理出自己想要的文本,只要把文本放进去点击分割就可以得到自己想要的文本了!!
  3. 所属分类:互联网

    • 发布日期:2020-07-06
    • 文件大小:716800
    • 提供者:qq_21058487
  1. Disaster_Response_Text_classification:Udacity纳米度灾难响应文本分类项目。 此回购协议有助于将灾难期间收到的文本分类为适当的类别,以便相关部门Swift做出响应-源码

  2. 灾难响应管道项目-(文本分类器-Udacity纳米学位计划) 该项目的目标是对短信进行分类,以帮助应对灾害 ·· 灾害响应管道项目 该项目适用于Udacity纳米学位课程。 它将文本消息分类为36个不同的变量。 快速说明: 在项目的根目录中运行以下命令来设置数据库和模型。 运行ETL管道以清理数据并将其存储在数据库中python data/process_data.py data/disaster_messages.csv data/disaster_categories.csv data
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:3145728
    • 提供者:weixin_42151373
  1. Python大数据处理库PySpark实战——使用PySpark处理文本多分类问题

  2. 【导读】我们知道,ApacheSpark在处理实时数据方面的能力非常出色,目前也在工业界广泛使用。本文通过使用SparkMachineLearningLibrary和PySpark来解决一个文本多分类问题,内容包括:数据提取、ModelPipeline、训练/测试数据集划分、模型训练和评价等,具体细节可以参考下面全文。ApacheSpark受到越来越多的关注,主要是因为它处理实时数据的能力。每天都有大量的数据需要被处理,如何实时地分析这些数据变得极其重要。另外,ApacheSpark可以再不采样
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:448512
    • 提供者:weixin_38551938
  1. MatchZoo:促进深层文本匹配模型的设计,比较和共享-源码

  2. 火柴 促进深层文本匹配模型的设计,比较和共享。 MatchZoo是一个通用的文本匹配工具包,它可以方便大家快速的实现,比较,以及分享最新的深度文本匹配模型。 :fire: 新闻: (MatchZoo的PyTorch版本)现已准备就绪。 MatchZoo的目标是为深层文本匹配研究提供高质量的代码库,例如文档检索,问题回答,会话响应排名和释义识别。 借助统一的数据处理管道,简化的模型配置和自动超参数调整功能,MatchZoo灵活易用。 任务 文字1 文字2 目的 释义识别 字符串1
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:6291456
    • 提供者:weixin_42099633
« 12 3 4 5 6 7 8 9 10 ... 23 »