您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 停用词(包含中英文停用词表)

  2. 包含中英文停用词表,希望在涉及过滤停用词的分词应用上,大家用得着。
  3. 所属分类:专业指导

    • 发布日期:2009-08-12
    • 文件大小:4096
    • 提供者:gdufs_iiip
  1. 中文停用词表(比较全面,有1208个停用词)

  2. 可用于分词后的过滤工作,比较全面 希望可以帮到大家 呵呵
  3. 所属分类:网络基础

    • 发布日期:2011-04-07
    • 文件大小:7168
    • 提供者:yangbao316
  1. 中文停用词表

  2. 中文处理中可能会用的停用词表,用来过滤掉无用信息。我综合处理了多个中文停用词表,希望能对大家有用。
  3. 所属分类:专业指导

    • 发布日期:2008-05-13
    • 文件大小:4096
    • 提供者:unicode1985
  1. 停用词词表(最全的)

  2. 在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词会形成一个停用词表。但是,并没有一个明确的停用词表能够适用于所有的工具。甚至有一些工具是明确地避免使用停用词来支持短语搜索的。
  3. 所属分类:Java

    • 发布日期:2013-05-20
    • 文件大小:6144
    • 提供者:houshengluan
  1. 文本分类所需停用词表

  2. 为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词就形成一个停用词表
  3. 所属分类:其它

    • 发布日期:2014-11-12
    • 文件大小:4096
    • 提供者:yangyao_iphone
  1. 中文停用词

  2. 很详细的停用词,效果比较好。最好代码里加入正则表达式的过滤
  3. 所属分类:讲义

    • 发布日期:2015-05-09
    • 文件大小:16384
    • 提供者:u013446987
  1. NLPIR分词、去停用词

  2. 整合 使用ICTCLAS2013(NlPIR) x64 的中文分词,分词的速度和效果都不错。然后就是对文本进行的去停用词以及特殊符号(哈工大停用词库)的去除,这些特殊符号还有标点符号,以及文本中夹杂的数字和字母会对分词的效果产生影响。eclipse GBK 编码
  3. 所属分类:互联网

  1. 结巴分词、词性标注以及停用词过滤

  2. 因为比赛需要用到结巴分词,所以写了一个关于结巴分词、词性标注以及停用词过滤的python程序。
  3. 所属分类:Python

    • 发布日期:2016-10-31
    • 文件大小:7340032
    • 提供者:qq_34068735
  1. 常见停用词词典

  2. 包含常见的停用词(包括英文通用词)。在做NLP时,停用词过滤可以用。
  3. 所属分类:深度学习

    • 发布日期:2018-09-28
    • 文件大小:17408
    • 提供者:hu993202016
  1. 史上最全中英文停用词

  2. 本资源收集了史上最全的停用词表 中文,英文全都包含其中 另附pycharm停用词表的构建 停用词过滤,是文本分析中一个预处理方法。它的功能是过滤分词结果中的噪声(例如:的、是、啊等)
  3. 所属分类:讲义

    • 发布日期:2018-10-24
    • 文件大小:46080
    • 提供者:terriblenet
  1. 中英文停用词表大全.zip

  2. 本资源包含各个版本的中英文停用词。停用词是指在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词会形成一个停用词表。
  3. 所属分类:机器学习

    • 发布日期:2019-07-14
    • 文件大小:44032
    • 提供者:huwanting
  1. 三个可能用到的停用词汇.zip

  2. 包括:中文停用词汇、哈工大停用词汇、四川大学机器智能实验室停用词汇。停用词是指在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词会形成一个停用词表。
  3. 所属分类:机器学习

    • 发布日期:2020-03-24
    • 文件大小:9216
    • 提供者:qq_37437983
  1. 文本分类所需停用词表

  2. 为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词就形成一个停用词表
  3. 所属分类:其它

    • 发布日期:2020-02-13
    • 文件大小:3072
    • 提供者:ximo881206
  1. 常用停用词表.txt

  2. 停用词是指在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词会形成一个停用词表。但是,并没有一个明确的停用词表能够适用于所有的工具。甚至有一些工具是明确地避免使用停用词来支持短语搜索的。
  3. 所属分类:算法与数据结构

    • 发布日期:2020-02-02
    • 文件大小:5120
    • 提供者:tanping0107
  1. 文本分类所需停用词表

  2. 为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词就形成一个停用词表
  3. 所属分类:其它

    • 发布日期:2020-01-12
    • 文件大小:3072
    • 提供者:jhfone
  1. 文本分类所需停用词表

  2. 为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词就形成一个停用词表
  3. 所属分类:其它

    • 发布日期:2019-10-19
    • 文件大小:3072
    • 提供者:etmessi
  1. 最全的中文停用词表20K-机器学习文档类资源(txt为微云链接)

  2. 在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词会形成一个停用词表。但是,并没有一个明确的停用词表能够适用于所有的工具。甚至有一些工具是明确地避免使用停用词来支持短语搜索的。
  3. 所属分类:互联网

    • 发布日期:2020-07-17
    • 文件大小:58
    • 提供者:qq_41934573
  1. 文本分类所需停用词表

  2. 为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词就形成一个停用词表
  3. 所属分类:其它

    • 发布日期:2020-10-30
    • 文件大小:3072
    • 提供者:downk
  1. 停用词:来自许多不同来源的默认英语停用词列表-源码

  2. 来自不同来源的默认英语停用词: 停用词过滤是预处理文本以实现各种目的的常用步骤。 这是从各种搜索引擎,库和文章中提取的几个不同停用词列表的列表。 列表数量惊人。 目前,这只是英文停用词。 文件 尺寸 资源 描述 0 没有停用词删除。 0 Sphinx是一个开源搜索服务器。 谷歌搜索狮身人面像停用词的顶部也导致两个手动编译的列表基于博客作者的帖子。 24 EBSCOhost医疗数据库MEDLINE和CINAHL中使用的停用词 28 在src / edu / stanford / n
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:83968
    • 提供者:weixin_42133415
  1. 文本分类所需停用词表

  2. 为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词就形成一个停用词表
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:3072
    • 提供者:q191201771
« 12 3 »