您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 一个简单的中文后向最大匹配分词系统

  2. 最大匹配算法的中文分词实现……其中常用词和停用词库根据情况更改即可
  3. 所属分类:Java

    • 发布日期:2011-04-19
    • 文件大小:14336
    • 提供者:butterfly1111
  1. 中文停用词 数据挖掘

  2. 中文停用词表,内容比较全面,停用词总数超过一万个,可以对文本挖掘中的停用词库进行补充
  3. 所属分类:其它

    • 发布日期:2013-06-08
    • 文件大小:77824
    • 提供者:wusang1
  1. NLPIR分词、去停用词

  2. 整合 使用ICTCLAS2013(NlPIR) x64 的中文分词,分词的速度和效果都不错。然后就是对文本进行的去停用词以及特殊符号(哈工大停用词库)的去除,这些特殊符号还有标点符号,以及文本中夹杂的数字和字母会对分词的效果产生影响。eclipse GBK 编码
  3. 所属分类:互联网

  1. ICTCLAS2013(NlPIR) x64 的中文分词

  2. 整合 使用ICTCLAS2013(NlPIR) x64 的中文分词,分词的速度和效果都不错。然后就是对文本进行的去停用词以及特殊符号(哈工大停用词库)的去除,这些特殊符号还有标点符号
  3. 所属分类:Java

    • 发布日期:2015-08-29
    • 文件大小:5242880
    • 提供者:eric_pengpeng
  1. 基于ICTCLAS中科院分词器实现Lucene4.9版本的中文分词功能,新增中英文停用词库,直接导入即可使用

  2. ICTCLAS中科院分词器实现Lucene4.9版本的中文分词功能,新增中英文停用词库,直接导入即可使用
  3. 所属分类:Java

    • 发布日期:2016-03-31
    • 文件大小:14680064
    • 提供者:u010895156
  1. 中文停用词表(共2694个)

  2. “哈工大停用词词库”、“四川大学机器学习智能实验室停用词库”、百度停用词表“及网上各种资源整理去重后得到,包括一些数字及字符
  3. 所属分类:其它

    • 发布日期:2017-03-01
    • 文件大小:21504
    • 提供者:vivian_ll
  1. 中文停用词列表

  2. 根据网上现有全部资源,对所谓“哈工大停用词词库”、“四川大学机器学习智能实验室停用词库”、百度停用词表“等等各种停用词表,整理去重在提取中文词(而不是大量英文词和中文标点符号)出了一个比较全面的词表出来,一共1598个。
  3. 所属分类:机器学习

    • 发布日期:2017-10-22
    • 文件大小:11264
    • 提供者:qq280929090
  1. 哈工大停用词词典

  2. 最全的停用词词典,根据网上现有全部资源,对所谓“哈工大停用词词库”、“四川大学机器学习智能实验室停用词库”、百度停用词表“等等各种停用词表,整理去重在提取中文词(而不是大量英文词和中文标点符号)出了一个比较全面的词表出来
  3. 所属分类:搜索引擎

    • 发布日期:2018-04-28
    • 文件大小:4096
    • 提供者:qq_30262201
  1. IKanalyzer约2000个常用停止词库

  2. 近期整理的IKAnalyzer中文停用词列表,大约有2000多个词,希望可以帮到大家,下载希望给个好评,谢谢
  3. 所属分类:Java

    • 发布日期:2018-07-25
    • 文件大小:6144
    • 提供者:tomakemyself
  1. 中文语料停用词

  2. 中文语料的停用词txt文档,取自复旦大学中文语料库,文件很小
  3. 所属分类:机器学习

    • 发布日期:2018-10-20
    • 文件大小:3072
    • 提供者:majinlei121
  1. NLPIR分词、去停用词

  2. 整合 使用ICTCLAS2013(NlPIR) x64 的中文分词,分词的速度和效果都不错。然后就是对文本进行的去停用词以及特殊符号(哈工大停用词库)的去除,这些特殊符号还有标点符号,以及文本中夹杂的数字和字母会对分词的效果产生影响。eclipse GBK 编码
  3. 所属分类:互联网

    • 发布日期:2018-12-20
    • 文件大小:5242880
    • 提供者:qq_22098033
  1. NLPIR分词、去停用词

  2. 整合 使用ICTCLAS2013(NlPIR) x64 的中文分词,分词的速度和效果都不错。然后就是对文本进行的去停用词以及特殊符号(哈工大停用词库)的去除,这些特殊符号还有标点符号,以及文本中夹杂的数字和字母会对分词的效果产生影响。eclipse GBK 编码
  3. 所属分类:互联网

    • 发布日期:2019-01-13
    • 文件大小:5242880
    • 提供者:weixin_44425171
  1. 词云停用词库.txt

  2. 结巴中文分词库最新分词停用词,安心放心使用,适合自定义,效果杠杠的! 不收费,如果收费的话,联系小编,改价格
  3. 所属分类:讲义

    • 发布日期:2020-04-27
    • 文件大小:19456
    • 提供者:weixin_45623093
  1. 中文停用词库 chineseStopWords.txt

  2. txt格式的中文停用词库 chineseStopWords.txt txt格式的中文停用词库 chineseStopWords.txt txt格式的中文停用词库 chineseStopWords.txt
  3. 所属分类:其它

    • 发布日期:2020-03-07
    • 文件大小:9216
    • 提供者:lztttao
  1. 中文哈工大百度川大合并的停用词表

  2. 由中文停用词表:cn_stopwords.txt,哈工大停用词表:hit_stopwords.txt,百度停用词表:baidu_stopwords.txt,四川大学机器智能实验室停用词库:scu_stopwords.txt(https://github.com/goto456/stopwords)合并而得,包含2690个停用词,编码格式为utf-8,python可以直接读取。
  3. 所属分类:互联网

    • 发布日期:2020-05-29
    • 文件大小:21504
    • 提供者:xmrzh
  1. python使用jieba实现中文分词去停用词方法示例

  2. jieba分词,完全开源,有集成的python库,简单易用。下面这篇文章主要给大家介绍了关于python使用jieba实现中文分词去停用词的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面来一起看看吧。
  3. 所属分类:其它

    • 发布日期:2020-09-20
    • 文件大小:47104
    • 提供者:weixin_38530202
  1. NLP停用词常用词库

  2. | 中文停用词表 | cn\_stopwords.txt | | 哈工大停用词表 | hit\_stopwords.txt | | 百度停用词表 | baidu\_stopwords.txt | | 四川大学机器智能实验室停用词库 | scu\_stopwords.txt |
  3. 所属分类:机器学习

    • 发布日期:2020-11-19
    • 文件大小:13312
    • 提供者:Lynqwest
  1. 中文停用词库.zip

  2. 分词词典: 综合了百度、搜狗等词库,以及手动整理的若干人名和新近出现的热词 中文停用词: 综合了"百度停用词表","哈工大停用词表","四川大学机器学习实验室停用词表"等若干停用词表,取交集并去除了不需要的标点符号和英文单词
  3. 所属分类:互联网

    • 发布日期:2020-12-04
    • 文件大小:22020096
    • 提供者:fangxiananvhai
  1. 最新中文停用词.txt

  2. 我下载了多个停用词表,将其合并后去重,得出这个最新的停用词表。欢迎下载使用。
  3. 所属分类:互联网

    • 发布日期:2021-02-28
    • 文件大小:22528
    • 提供者:qq_42658739
  1. funNLP:中英文敏感词,语言检测,中外手机电话归属地运营商查询,名字性别,手机号删除,身份证提取,邮箱删除,中日文人名库,中文缩写库,拆字词典,词汇情感值,停用词,反动词表,暴恐词表,繁简体转换,英语模拟中文最佳,汪峰歌词生成器,职业名

  2. NLP民工的乐园 最强大的NLP武器库 NLP民工的乐园:几乎最全的中文NLP资源库 词库 工具包 学习资料 在入门到熟悉NLP的过程中,用到了很多github上的包,遂整理了一下,分享在这里。 很多包非常有趣,值得收藏,满足大家的收集癖!如果觉得有用,请分享并star,谢谢! 长期不定时更新,欢迎手表和叉子! 涉及内容包括但不限于:中英文敏感词,语言检测,中外手机/电话归属​​地/运营商查询,名字,名称,性别,手机号撤回,身份证删除,邮箱删除,中日文人名库,中文缩写库,拆字字典,词汇情感值,替
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:72351744
    • 提供者:weixin_42139460
« 12 3 »