您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. jieba 分词

  2. 组件只提供jieba.cut 方法用于分词 cut方法接受两个输入参数:   第一个参数为需要分词的字符串   cut_all参数用来控制分词模式 待分词的字符串可以是gbk字符串、utf-8字符串或者unicode jieba.cut返回的结构是一个可迭代的generator,可以使用for循环来获得分词后得到的每一个词语(unicode),也可以用list(jieba.cut(...))转化为list
  3. 所属分类:Python

    • 发布日期:2016-08-16
    • 文件大小:7340032
    • 提供者:siolioy
  1. jieba分词资源包

  2. 结巴分词用到的资源文件,使用方式见博客
  3. 所属分类:Java

    • 发布日期:2016-11-16
    • 文件大小:1048576
    • 提供者:wbcg111
  1. jieba分词支持关键词带空格和特殊字符

  2. jieba分词支持关键词带空格和特殊字符
  3. 所属分类:Python

    • 发布日期:2017-02-21
    • 文件大小:19456
    • 提供者:wangpei1949
  1. 运用Jieba分词对红楼婪进行词云分析

  2. 运用Jieba分词对红楼婪进行词云分析,可以分析红楼梦中词频及人物关系。
  3. 所属分类:教育

    • 发布日期:2018-05-09
    • 文件大小:109568
    • 提供者:bowen2006
  1. java版jieba分词统计,含1.02版本jar

  2. 结巴分词,jieba分词,统计分词出现的频率,按频率统计分词出现的频率。
  3. 所属分类:Java

    • 发布日期:2018-06-14
    • 文件大小:6291456
    • 提供者:qq_26408545
  1. jieba分词器字典

  2. jieba分词器所用的字典,包含词频以及词性,可自行调整频次等属性。(仅做学习交流用,禁止商用)
  3. 所属分类:机器学习

    • 发布日期:2018-07-13
    • 文件大小:4194304
    • 提供者:rex_gallon
  1. jieba分词java版项目

  2. jieba分词java版项目,解压文件后,用eclipse导入项目后,执行run包下的test程序即可。
  3. 所属分类:Java

    • 发布日期:2018-02-08
    • 文件大小:4194304
    • 提供者:u012483103
  1. 结巴分词中一部分自定义字典

  2. 本人在使用jieba分词做项目时,锁整理出来的一部分被切分的词
  3. 所属分类:机器学习

    • 发布日期:2018-09-25
    • 文件大小:1024
    • 提供者:weixin_43173880
  1. jieba分词资源包

  2. 结巴分词用到的资源文件,使用方式见博客 结巴分词用到的资源文件,使用方式见博客 结巴分词用到的资源文件,使用方式见博客 结巴分词用到的资源文件,使用方式见博客
  3. 所属分类:Java

    • 发布日期:2019-07-08
    • 文件大小:1048576
    • 提供者:etmessi
  1. jieba分词资源包

  2. 结巴分词用到的资源文件,使用方式见博客
  3. 所属分类:Java

    • 发布日期:2020-06-09
    • 文件大小:1048576
    • 提供者:yzucyj
  1. python同义词替换的实现(jieba分词)

  2. 主要介绍了python同义词替换的实现(jieba分词),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
  3. 所属分类:其它

    • 发布日期:2020-09-18
    • 文件大小:48128
    • 提供者:weixin_38641764
  1. Django实现whoosh搜索引擎使用jieba分词

  2. 主要介绍了Django实现whoosh搜索引擎使用jieba分词,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
  3. 所属分类:其它

    • 发布日期:2020-09-17
    • 文件大小:241664
    • 提供者:weixin_38692707
  1. 浅谈python jieba分词模块的基本用法

  2. 本篇文章主要介绍了浅谈python jieba分词模块的基本用法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
  3. 所属分类:其它

    • 发布日期:2020-09-21
    • 文件大小:96256
    • 提供者:weixin_38659622
  1. jieba分词器 java版

  2. 本人最近在用lucene做一些东西,需要用到jieba分词器。但csdn上的资源都是需要积分的,一个开源软件竟然还要积分。。。从github找的,分享给大家吧
  3. 所属分类:Java

    • 发布日期:2020-10-10
    • 文件大小:2097152
    • 提供者:weixin_43820378
  1. Jieba分词.rar

  2. 针对jieba的各种分词模式进行测试,并且给出了对三国演义的关键词提取,以及数据集,同时包括其他常用分词数据集
  3. 所属分类:Python

    • 发布日期:2020-11-21
    • 文件大小:5242880
    • 提供者:qq_44465615
  1. 《中文jieba分词》总结

  2. 针对jieba分词作业做一个总结,方便以后查看。 中文分词 分词,即切词,在NLP文本预处理中经常使用一些方法来对文本进行分词,从而使文本从“字序列”升级到“词序列”。 为什么要进行分词?在中文中,一个个汉字有其自身的含义,但是组成词语时,其含义可能会发生很大的变化,使得之后进行文本处理任务时不能很好的理解句子的含义。(比如“和”,“平”,“和平”,三者的含义有很大的不同。)另外,从字序列升级成词序列,可以使模型能够得到更高级的特征。 分词算法有很多,比如正向最大匹配算法,逆向最大匹配算法,双向
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:61440
    • 提供者:weixin_38591291
  1. jieba分词资源包

  2. 结巴分词用到的资源文件,使用方式见博客 结巴分词用到的资源文件,使用方式见博客 结巴分词用到的资源文件,使用方式见博客 结巴分词用到的资源文件,使用方式见博客
  3. 所属分类:Java

    • 发布日期:2021-02-09
    • 文件大小:1048576
    • 提供者:magicnono
  1. jieba分词关键字含英文和特殊字符的处理方法

  2. 1.默认情况 语句中关键字在含有英文和特殊字符时(machine-1234),使用jieba往往将我们的关键词分割的非常零碎,比如: # 默认情况 import jieba str1 = 查找machine-1234的产品说明书 for w in jieba.cut(str1): print(w) # 运行结果 >>>查找 >>>machine >>>- >>>1234 >>>的 >>&
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:32768
    • 提供者:weixin_38545243
  1. jieba分词详解和实践

  2. jieba分词是目前最好的 python中文分词组件。在讲解jieba分词之前,我们先了解一下中文分词的一些概念: 最常用的TF-IDF 什么是TF-IDF呢?要分成2个部分来理解。 TF,词频——一个词在文章中出现的次数 IDF,在词频的基础上,赋予每个词一个权重,体现该词的重要性。 这是什么意思呢?我们来看个例子。 这是一条财经类新闻 上周 / 沉寂 / 一段 / 时间 / 的 / 白酒股 / 卷土重来 / ;/ 其中 / 古井贡酒 / 的 / 股价 / 创出 / 了 / 历史新高 / ,
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:39936
    • 提供者:weixin_38534352
  1. Django实现whoosh搜索引擎使用jieba分词

  2. 本文介绍了Django实现whoosh搜索引擎使用jieba分词,分享给大家,具体如下: Django版本:3.0.4 python包准备: pip install django-haystack pip install jieba 使用jieba分词 1.cd到site-packages内的haystack包,创建并编辑ChineseAnalyzer.py文件 # (注意:pip安装的是django-haystack,但是实际包的文件夹名字为haystack) cd /usr/local/
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:235520
    • 提供者:weixin_38628920
« 12 3 4 5 6 7 8 9 10 »