您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 一种基于N-gram模型和机器学习的汉语分词算法

  2. 一种基于N-gram模型和机器学习的汉语分词算法,不错的分词算法。
  3. 所属分类:其它

    • 发布日期:2009-12-26
    • 文件大小:1048576
    • 提供者:sutine
  1. 基于n-gram的文本分类

  2. 基础文档,曾被国际上多次引用。通过多反面对比了n-gram技术在文字引索中的应用。
  3. 所属分类:网络基础

    • 发布日期:2012-05-06
    • 文件大小:74752
    • 提供者:pokemones3
  1. 基于n-gram中英文字符串分割算法实现

  2. 基于n-gram中英文字符串分割算法实现
  3. 所属分类:Perl

  1. 基于N-Gram的语言识别技术

  2. 基于N-Gram的语言识别技术,非常有启发性,网上还有很多open-source的代码可以学习。
  3. 所属分类:其它

    • 发布日期:2008-09-04
    • 文件大小:43008
    • 提供者:the3gwireless
  1. 一种基于N-Gram改进的文本特征提取算法

  2. 一种基于N-Gram改进的文本特征提取算法
  3. 所属分类:Java

    • 发布日期:2014-04-08
    • 文件大小:379904
    • 提供者:u014598501
  1. 一种基于n-gram短语的文本聚类方法研究

  2. 一种基于n-gram短语的文本聚类方法研究
  3. 所属分类:机器学习

    • 发布日期:2017-07-24
    • 文件大小:505856
    • 提供者:yuxu9710108
  1. 毕业论文范文基于N-Gram的G蛋白偶联序列分类方法的研究

  2. 毕业论文范文基于N-Gram的G蛋白偶联序列分类方法的研究
  3. 所属分类:其它

    • 发布日期:2018-06-05
    • 文件大小:121856
    • 提供者:ai763978985
  1. 基于N-Gram和TF-IDF的URL特征提取系统的研究与实现

  2. 基于N-Gram和TF-IDF的URL特征提取系统的研究与实现,葛峰,罗守山,针对web的日志分析通常会对URL进行特征提取,由于URL中可能包含未解码参数,直接使用传统特征提取算法对其进行特征提取会造成提取出
  3. 所属分类:其它

    • 发布日期:2020-01-31
    • 文件大小:809984
    • 提供者:weixin_38600460
  1. N-Gram-Based Text Categorization.pdf

  2. 基于n-gram的文本识别论文。William B. Cavnar and John M. Trenkle Environmental Research Institute of Michigan
  3. 所属分类:互联网

    • 发布日期:2020-08-30
    • 文件大小:145408
    • 提供者:weixin_50005008
  1. 基于MapReduce的三元N-gram算法的并行化研究

  2. 大规模语料库的训练是使用三元N-gram算法进行中文文本自动查错中一个重要的基础工作。面对新媒体平台每日高达百万篇需处理的语料信息,单一节点的三元N-gram语言模型词库的构建存在计算瓶颈。在深入研究三元N-gram算法的基础上,提出了基于MapReduce计算模型的三元N-gram并行化算法的思想。MapReduce计算模型中,将运算任务平均分配到m个节点,三元N-gram算法在Map函数部分的主要任务是计算局部字词分别与其前两个字词搭配出现的次数,Reduce函数部分的主要任务是合并Map部
  3. 所属分类:其它

    • 发布日期:2020-10-15
    • 文件大小:354304
    • 提供者:weixin_38750003
  1. 基于N-Gram的计算机病毒特征码自动提取的改进方法.7z

  2. 【转发】【引用】【论文】随着计算机技术的发展和普及,计算机病毒带来的危害日趋严重。传统 N-Gram 算法难以提取不同长度的特征,导致有效特征缺失,并产生庞大的特征集合,造成空间的浪费。针对这些问题,提出一种改进的基于 N-Gram 的特征码自动提取方法。该方法在原有 N-Gram 特征才是取算法的基础上引入变长 N-Gram 特征,才是取不同长度的有效特征,生成不定长病毒特征码。综合考虑特征频率的相关性,利用特征浓度对 N-Gram 特征进行有向筛选,生成数据字典,节省存储空间。实验结果表明,
  3. 所属分类:网络安全

    • 发布日期:2021-03-24
    • 文件大小:708608
    • 提供者:wonderdaydream
  1. 基于研究N-gram的维吾尔文文本分类技术

  2. 基于研究N-gram的维吾尔文文本分类技术
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:467968
    • 提供者:weixin_38546622
  1. 使用N-Gram模型基于特征扩展的短文本分类

  2. 使用N-Gram模型基于特征扩展的短文本分类
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:517120
    • 提供者:weixin_38522106
  1. mongoid_fulltext:Mongoid ODM的基于n-gram的全文本搜索实现-源码

  2. 蒙古文全文搜索 使用针对Mongoid ODM的n元语法匹配进行全文搜索。 MongoDB在v2.4中引入了全文本搜索功能,因此,该gem非常适合于您想要的东西少于成熟的索引服务的情况。 mongoid_fulltext gem可让您在相对较短的字符串中进行模糊字符串搜索,这非常适合根据Rails模型的显示名称填充自动完成框,但不适用于为成千上万HTML文档建立索引。 安装 此gem的0.6.1或更高版本需要Ruby 1.9.3或更高版本,并且可以与Mongoid 3、4、5和6一起使用。对
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:36864
    • 提供者:weixin_42097819
  1. 基于n-gram卷积神经网络的MoRF预测

  2. 基于n-gram卷积神经网络的MoRF预测
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:338944
    • 提供者:weixin_38590790
  1. 基于N-Gram模型的蒙古语文本语种识别算法的研究

  2. 基于N-Gram模型的蒙古语文本语种识别算法的研究
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:321536
    • 提供者:weixin_38666527
  1. textcat:Go包,用于基于n-gram的文本分类,并支持utf-8和原始文本-源码

  2. 一个Go包,用于基于n-gram的文本分类,并支持utf-8和原始文本。 去做: 写文件 使它更快 关键字:文本分类,语言检测器 安装 go get github.com/pebbe/textcat go get github.com/pebbe/textcat/textcat go get github.com/pebbe/textcat/textpat 文件
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:536576
    • 提供者:weixin_42146086
  1. 基于N-gram语言模型的哈萨克文机构名识别

  2. 针对哈萨克文文本中机构名构成特点,提出了一种基于N-gram语言模型的哈萨克文机构名可信度计算方法,并以机构名尾词为触发词,构建了一个哈萨克文机构名识别系统。系统分为训练和识别两个模块,识别过程是:首先从训练语料中提取特征进行训练,得到一个特征训练模型,然后利用训练好的特征模型及少量的附加规则,对测试文本中的机构名进行识别,实验结果表明该方法可行。
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:345088
    • 提供者:weixin_38506852
  1. 基于N-GRAM的朝鲜文索引方法与性能评价

  2. 进行朝鲜文索引时,需要通过分析音节和词素而把名词提取成索引词,但词典中未登录词将造成分析工作的模糊性,从而导致不能进行正确索引。本文基于N-gram有利于分析词典中未登录词的特性,提出一种新的朝鲜文索引方法。通过对比分析和性能评价表明,所提出的方法是有效的。
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:1048576
    • 提供者:weixin_38563525
  1. pygrams:从大量文档(> 1000)中提取关键术语(n-gram)并预测出现-源码

  2. 工具说明 这个基于python的应用程序( pygrams.py )旨在从大量(> 1,000)文档pygrams.py自由文本中提取流行或紧急出现的n-gram /术语(单词或短短语)。 出于测试目的,包括了已授予专利文件摘要的示例语料库。 应用程序管道(用户选项部分中的更多详细信息): 数据可以通过几种文本文档类型(例如,csv,xls,腌制的python数据框等)。 这是整个语料库中经过处理的术语(ngram)列表。 这些术语是稀疏矩阵的列。 用户可以控制以下参数:最小文档频率
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:354418688
    • 提供者:weixin_42169971
« 12 3 4 »