您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 结巴分词(支持词性标注)

  2. 结巴分词早期版本。 * 结巴分词(java版) jieba-analysis 首先感谢jieba分词原作者[[https://github.com/fxsjy][fxsjy]],没有他的无私贡献,我们也不会结识到结巴 分词,更不会有现在的java版本。 结巴分词的原始版本为python编写,目前该项目在github上的关注量为170, 打星727次(最新的数据以原仓库为准),Fork238次,可以说已经有一定的用户群。 结巴分词(java版)只保留的原项目针对搜索引擎分词的功能(cut_for
  3. 所属分类:深度学习

    • 发布日期:2018-12-17
    • 文件大小:3145728
    • 提供者:qq_34859668
  1. Python 含中文分词的多项式贝叶斯的增量学习的文本分类.rar

  2. 本源码中包括两个Python案例:1、基于潜在狄利克雷分配(LDA)模型的内容主题挖掘。2、基于多项式贝叶斯的增量学习的文本分类。依赖库:sys、re、tarfile、os、numpy、bs4、sklearn   程序输入:article.txt、news_data.tar.gz   程序输出:打印输出18个主题及新文本的预测主题归属   程序实现功能:全角转半角、解析文件内容、从原始文件中解析出文本内容和标签数据、以列表形式返回文本中的所有内容和对应标签、交叉检验、将训练集文本数据转换为稀疏
  3. 所属分类:其它

    • 发布日期:2019-07-10
    • 文件大小:18874368
    • 提供者:weixin_39840924
  1. Python实现全角半角字符互转的方法

  2. 大家都知道在自然语言处理过程中,全角、半角的的不一致会导致信息抽取不一致,因此需要统一。这篇文章通过示例代码给大家详细的介绍了Python实现全角半角字符互转的方法,有需要的朋友们可以参考借鉴,下面跟着小编一起学习学习吧。
  3. 所属分类:其它

    • 发布日期:2020-09-21
    • 文件大小:80896
    • 提供者:weixin_38499706
  1. Python实现全角半角字符互转的方法

  2. 前言 相信对于每一个编程人员来说,在文本处理的时候,经常会遇到全角半角不一致的问题。于是需要程序能够快速的在两者之间互转。由于全角半角本身存在着映射关系,所以处理起来并不复杂。 具体规则为:       全角字符unicode编码从65281~65374 (十六进制 0xFF01 ~ 0xFF5E)       半角字符unicode编码从33~126 (十六进制 0x21~ 0x7E)       空格比较特殊,全角为 12288(0x3000),半角为 32(0x20)      
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:77824
    • 提供者:weixin_38589168
  1. Python实现全角半角转换的方法

  2. 本文实例讲解了Python实现全角半角转换的方法,相信对于大家的Python学习能够起到一定的参考借鉴价值。如下所示: 一、全角半角转换概述: 全角字符unicode编码从65281~65374 (十六进制 0xFF01 ~ 0xFF5E) 半角字符unicode编码从33~126 (十六进制 0x21~ 0x7E) 空格比较特殊,全角为 12288(0x3000),半角为 32 (0x20) 而且除空格外,全角/半角按unicode编码排序在顺序上是对应的 所以可以直接通过用+-法来处理非空格
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:35840
    • 提供者:weixin_38558246