您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 中科院汉语分词工具

  2. 中科院汉语分词工具ICTCLAS,中文分词,文本分词,基于C++开发
  3. 所属分类:C/C++

    • 发布日期:2011-12-20
    • 文件大小:3145728
    • 提供者:xu_haiwen
  1. 基于向量空间模型的中文文本分类技术研究

  2. 0引言伴随着文本挖掘技术的发展,文本分词技术作为文本挖掘技术的一个重要研究分支,也得到了迅速的发展.文本分词技术为大多数文本挖掘技术(如文本分类技术,文本聚类技术等)提供文本预处理工作,分词效果的好坏会直接影响到后续的处理过程,因此文本分词技术是文本挖掘过程中的
  3. 所属分类:Java

    • 发布日期:2013-07-02
    • 文件大小:494592
    • 提供者:u011272837
  1. python代码

  2. python进行文本分词过滤处理,代码简单,支持中文文本
  3. 所属分类:Python

    • 发布日期:2015-03-14
    • 文件大小:2048
    • 提供者:muziqingqing
  1. BSBI倒排索引算法

  2. python3.6实现中文语料文本的BSBI算法(倒排索引)索引程序实现。包括中文文本分词,停用词表。
  3. 所属分类:专业指导

    • 发布日期:2018-10-29
    • 文件大小:86016
    • 提供者:kingle123
  1. python文本分词,去停用词,包含基础停用词词典

  2. 用于中文文本分词,去停用词,包含基本的停用词词典,可根据需要进行扩充。
  3. 所属分类:Python

    • 发布日期:2019-03-06
    • 文件大小:7168
    • 提供者:u013293771
  1. 中文分词算法.docx

  2. 1、颗粒度越大越好:用于进行语义分析的文本分词,要求分词结果的颗粒度越大,即单词的字数越多,所能表示的含义越确切,如:“公安局长”可以分为“公安 局长”、“公安局 长”、“公安局长”都算对,但是要用于语义分析,则“公安局长”的分词结果最好(当然前提是所使用的词典中有这个词)
  3. 所属分类:Java

    • 发布日期:2020-04-17
    • 文件大小:18432
    • 提供者:qq_41936098
  1. 中文停用词表

  2. 1209个中文停用词,可用于文本分词,去掉那些常出现的但是没有意义的词
  3. 所属分类:Java

    • 发布日期:2011-11-27
    • 文件大小:7168
    • 提供者:etic2009
  1. 中文文本分词PPT(详细讲解HMM)

  2. PPT中包含基于词典分词算法以及HMM(隐马尔可夫模型)算法,结巴分词(具体实现算法)等内容,PPT中包含基于词典分词算法以及HMM(隐马尔可夫模型)算法,结巴分词(具体实现算法)等内容
  3. 所属分类:深度学习

    • 发布日期:2020-12-12
    • 文件大小:3145728
    • 提供者:weixin_40732165
  1. 基于条件随机场的中文短文本分词方法

  2. 中文分词是信息检索工作的一项先决任务。随着大数据时代的到来,信息检索工作对于中文分词准确率和召回率的要求也不断提高。该文提出了一种针对中文短文本的分词方法。该方法首先利用机器学习中的条件随机场模型对待处理的中文短文本进行初步分词,然后再利用传统词典分词方法对初步分词结果进行修正,从而完成分词工作。针对中文短文本的特点,该方法在条件随机场的标记选择和特征模板编写上做了相应优化。测试结果表明,该方法改善了传统的基于词典的分词法因为未登录词和交叠歧义而产生的准确率和召回率下降的问题,并在Sighan
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:354304
    • 提供者:weixin_38689736