您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 文本分类之词频统计(分词、词干提取、去停用词、计算词频,有界面)

  2. 主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用
  3. 所属分类:专业指导

    • 发布日期:2010-05-12
    • 文件大小:72704
    • 提供者:xiangxiangqin
  1. C#编写的提取英文词干的算法

  2. 在词法学和信息检索里,词干提取是去除词缀得到词根的过程─—得到单词最一般的写法。该代码是在其他语言基础上进行简单转换修改后的C#版。
  3. 所属分类:C#

    • 发布日期:2015-04-09
    • 文件大小:16384
    • 提供者:sanweixianshi
  1. 文本分类之词频统计(分词、词干提取、去停用词、计算词频,有界面)

  2. 主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用
  3. 所属分类:专业指导

    • 发布日期:2019-07-13
    • 文件大小:71680
    • 提供者:wnto_fly_meow
  1. 文本分类之词频统计(分词、词干提取、去停用词、计算词频,有界面)

  2. 主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用
  3. 所属分类:专业指导

    • 发布日期:2019-03-02
    • 文件大小:71680
    • 提供者:weixin_44713005
  1. 在Python中使用NLTK库实现对词干的提取的教程

  2. 主要介绍了在Python中使用NLTK库实现对词干的提取的教程,其中还用到了Pandas和IPython,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-22
    • 文件大小:155648
    • 提供者:weixin_38738528
  1. Python自然语言处理之词干,词形与最大匹配算法代码详解

  2. 主要介绍了Python自然语言处理之词干,词形与MaxMatch算法代码详解,涉及词干提取,词形还原,简单总结了二者的区别和联系,最后还分享了最大匹配算法的相关示例,具有一定参考价值,需要的朋友可以了解下。
  3. 所属分类:其它

    • 发布日期:2020-09-21
    • 文件大小:84992
    • 提供者:weixin_38717896
  1. Python自然语言处理之词干,词形与最大匹配算法代码详解

  2. 本文主要对词干提取及词形还原以及最大匹配算法进行了介绍和代码示例,Python实现,下面我们一起看看具体内容。 自然语言处理中一个很重要的操作就是所谓的stemming和lemmatization,二者非常类似。它们是词形规范化的两类重要方式,都能够达到有效归并词形的目的,二者既有联系也有区别。 1、词干提取(stemming) 定义:Stemmingistheprocessforreducinginflected(orsometimesderived)wordstotheirstem,base
  3. 所属分类:其它

    • 发布日期:2020-12-24
    • 文件大小:87040
    • 提供者:weixin_38623919
  1. 第2章 文本的歧义及其清理(包括,分词,去除停用词,词干提取,词形还原等)

  2. 第2章 文本的歧义及其清理 文本处理的过程: 词项化—>去除停用词—->词干提取或词形还原 1. 简单看看json文件的基本内容: example.json: { “array”: [1,2,3,4], “boolean”: “True”, “object”: { “a”: “b” }, “string”: “Hello World” } 简单的处理代码: import json #打开文件 jsonfile=open("example.json") #加载数据 data=json
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:108544
    • 提供者:weixin_38723753
  1. python基础编程:Python自然语言处理之词干,词形与最大匹配算法代码详解

  2. 本文主要对词干提取及词形还原以及最大匹配算法进行了介绍和代码示例,Python实现,下面我们一起看看具体内容。 自然语言处理中一个很重要的操作就是所谓的stemming和lemmatization,二者非常类似。它们是词形规范化的两类重要方式,都能够达到有效归并词形的目的,二者既有联系也有区别。 1、词干提取(stemming) 定义:Stemmingistheprocessforreducinginflected(orsometimesderived)wordstotheirstem,base
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:81920
    • 提供者:weixin_38638163
  1. 基于词干提取的维吾尔语事件类时间短语识别

  2. 基于词干提取的维吾尔语事件类时间短语识别
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:316416
    • 提供者:weixin_38605967
  1. 基于混合方法的维吾尔文名词词干提取系统

  2. 基于混合方法的维吾尔文名词词干提取系统
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:917504
    • 提供者:weixin_38565480
  1. 基于标注词典和规则的维吾尔文动词词干提取方法

  2. 利用语言学专家人工标注的语料库对维吾尔文动词进行研究,并总结出了维吾尔文动词范畴的连接规则框架.在人工标注的实例库的基础上,收集了词缀连接规则集合,经人工纠正构建了词缀连接规则库集合.最终,结合人工标注实例库、词缀连接规则库及维吾尔文动词范畴的连接规则框架提出了维吾尔文动词词干提取方法,该方法的独立实验准确率达到了84.15%.
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:288768
    • 提供者:weixin_38519681
  1. 词干形式-源码

  2. 词干形式
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:6144
    • 提供者:weixin_42099302
  1. nlp-js-tools-french:POS Tagger,lemmatizer和词干分析器,用于javascript中的法语-源码

  2. 用于法语的NLP Javascr ipt工具 Tokenize,POS Tagger,词条分解器和词干分析器 该软件包部分基于和Moratuwa大学的Kasun Gajasinghe的 该软件包提供了4种javascr ipt法语语言NLP工具: 代币化 POS标签 合法化 抽干 安装 npm install nlp-js-tools-french 用法 var NlpjsTFr = require('nlp-js-tools-french'); 语料库使用 var corpus = "Ell
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:1048576
    • 提供者:weixin_42153793
  1. hunspell:R的高性能词干分析器,令牌生成器和拼写检查器-源码

  2. hunspell:R的高性能词干分析器,令牌生成器和拼写检查器
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:2097152
    • 提供者:weixin_42157166
  1. stemmer.cr:Crystal的英语词干-源码

  2. stemmer.cr:Crystal的英语词干
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:115712
    • 提供者:weixin_42114580
  1. CISTEM:德语词干-源码

  2. CISTEM CISTEM是德语的词干算法,由LeonieWeißweiler和Alexander Fraser开发。 该存储库包含各种编程语言的官方实现。 目前,以下语言可用: Python Java C ++ C Java脚本 走 哈斯克尔 Perl Swift 每种语言的代码都包含一种用于词干的方法以及一种用于切分的方法,该方法返回剥离的后缀和词干。 性能 我们对六种公开可用的德国词干进行了比较分析,其中CISTEM在f-measure方面取得了最佳结果,在运行时取得了最新结果。
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:1048576
    • 提供者:weixin_42138780
  1. lorca:Node.js中西班牙语的自然语言处理。 词干分析,情感分析,可读性,带电池的tf-idf,一致性等等!-源码

  2. Lorca.js Lorca是使用javascr ipt编写的西班牙语NLP库。 标记化,一致性,词干分析,统计信息,情感分析,可读性,TF IDF等! 安装 客户端 目前尚不支持,但很快。 服务器端 跑: $ npm install lorca-nlp 开始使用类似的库: const lorca = require ( 'lorca-nlp' ) ; var doc = lorca ( 'esto es un test' ) ; doc . words ( ) . get ( ) ;
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:782336
    • 提供者:weixin_42181545
  1. ROUGE-2.0:ROUGE自动摘要评估工具包。 支持ROUGE- [N,L,S,SU],不同语言的词干和停用词,unicode文本评估,CSV输出-源码

  2. ROUGE 2.0 ROUGE 2.0是用于自动汇总任务的易于使用的评估工具包。 它使用度量标准系统,该系统通过将自动生成的摘要或翻译与一组参考摘要(通常是人为生成的)进行比较来工作。 ROUGE是计算自动生成的摘要的有效性的标准方法之一。 要了解ROUGE的工作原理,请。 产品特点 最新版本的ROUGE 2.0支持以下功能: 评估ROUGE-N(字母,二元组,三元组等) 评估ROUGE-L(总水平LCS) 对ROUGE-S和ROUGE-SU的评估(带有单字的跳字和跳字) 一次性评估多
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:236978176
    • 提供者:weixin_42133753
  1. 在Python中使用NLTK库实现对词干的提取的教程

  2. 什么是词干提取? 在语言形态学和信息检索里,词干提取是去除词缀得到词根的过程─—得到单词最一般的写法。对于一个词的形态词根,词干并不需要完全相同;相关的词映射到同一个词干一般能得到满意的结果,即使该词干不是词的有效根。从1968年开始在计算机科学领域出现了词干提取的相应算法。很多搜索引擎在处理词汇时,对同义词采用相同的词干作为查询拓展,该过程叫做归并。 一个面向英语的词干提取器,例如,要识别字符串“cats”、“catlike”和“catty”是基于词根“cat”;“stemmer”、“stem
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:160768
    • 提供者:weixin_38517728
« 12 3 4 5 6 7 8 »