搜索资源 - 基于N-Gram - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 基于N-Gram

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

一种基于N-gram模型和机器学习的汉语分词算法
一种基于N-gram模型和机器学习的汉语分词算法，不错的分词算法。
所属分类：其它
- 发布日期：2009-12-26
- 文件大小：1048576
- 提供者：sutine

基于n-gram的文本分类
基础文档，曾被国际上多次引用。通过多反面对比了n-gram技术在文字引索中的应用。
所属分类：网络基础
- 发布日期：2012-05-06
- 文件大小：74752
- 提供者：pokemones3

基于n-gram中英文字符串分割算法实现
基于n-gram中英文字符串分割算法实现
所属分类：Perl
- 发布日期：2012-10-13
- 文件大小：1048576
- 提供者：doushixieshenmea

基于N-Gram的语言识别技术
基于N-Gram的语言识别技术，非常有启发性，网上还有很多open-source的代码可以学习。
所属分类：其它
- 发布日期：2008-09-04
- 文件大小：43008
- 提供者：the3gwireless

一种基于N-Gram改进的文本特征提取算法
一种基于N-Gram改进的文本特征提取算法
所属分类：Java
- 发布日期：2014-04-08
- 文件大小：379904
- 提供者：u014598501

一种基于n-gram短语的文本聚类方法研究
一种基于n-gram短语的文本聚类方法研究
所属分类：机器学习
- 发布日期：2017-07-24
- 文件大小：505856
- 提供者：yuxu9710108

毕业论文范文基于N-Gram的G蛋白偶联序列分类方法的研究
毕业论文范文基于N-Gram的G蛋白偶联序列分类方法的研究
所属分类：其它
- 发布日期：2018-06-05
- 文件大小：121856
- 提供者：ai763978985

基于N-Gram和TF-IDF的URL特征提取系统的研究与实现
基于N-Gram和TF-IDF的URL特征提取系统的研究与实现，葛峰，罗守山，针对web的日志分析通常会对URL进行特征提取，由于URL中可能包含未解码参数，直接使用传统特征提取算法对其进行特征提取会造成提取出
所属分类：其它
- 发布日期：2020-01-31
- 文件大小：809984
- 提供者：weixin_38600460

N-Gram-Based Text Categorization.pdf
基于n-gram的文本识别论文。William B. Cavnar and John M. Trenkle Environmental Research Institute of Michigan
所属分类：互联网
- 发布日期：2020-08-30
- 文件大小：145408
- 提供者：weixin_50005008

基于MapReduce的三元N-gram算法的并行化研究
大规模语料库的训练是使用三元N-gram算法进行中文文本自动查错中一个重要的基础工作。面对新媒体平台每日高达百万篇需处理的语料信息，单一节点的三元N-gram语言模型词库的构建存在计算瓶颈。在深入研究三元N-gram算法的基础上，提出了基于MapReduce计算模型的三元N-gram并行化算法的思想。MapReduce计算模型中，将运算任务平均分配到m个节点，三元N-gram算法在Map函数部分的主要任务是计算局部字词分别与其前两个字词搭配出现的次数，Reduce函数部分的主要任务是合并Map部
所属分类：其它
- 发布日期：2020-10-15
- 文件大小：354304
- 提供者：weixin_38750003

基于N-Gram的计算机病毒特征码自动提取的改进方法.7z
【转发】【引用】【论文】随着计算机技术的发展和普及，计算机病毒带来的危害日趋严重。传统 N-Gram 算法难以提取不同长度的特征，导致有效特征缺失，并产生庞大的特征集合，造成空间的浪费。针对这些问题，提出一种改进的基于 N-Gram 的特征码自动提取方法。该方法在原有 N-Gram 特征才是取算法的基础上引入变长 N-Gram 特征，才是取不同长度的有效特征，生成不定长病毒特征码。综合考虑特征频率的相关性，利用特征浓度对 N-Gram 特征进行有向筛选，生成数据字典，节省存储空间。实验结果表明，
所属分类：网络安全
- 发布日期：2021-03-24
- 文件大小：708608
- 提供者：wonderdaydream

基于研究N-gram的维吾尔文文本分类技术
基于研究N-gram的维吾尔文文本分类技术
所属分类：其它
- 发布日期：2021-03-12
- 文件大小：467968
- 提供者：weixin_38546622

使用N-Gram模型基于特征扩展的短文本分类
使用N-Gram模型基于特征扩展的短文本分类
所属分类：其它
- 发布日期：2021-03-06
- 文件大小：517120
- 提供者：weixin_38522106

mongoid_fulltext:Mongoid ODM的基于n-gram的全文本搜索实现-源码
蒙古文全文搜索使用针对Mongoid ODM的n元语法匹配进行全文搜索。 MongoDB在v2.4中引入了全文本搜索功能，因此，该gem非常适合于您想要的东西少于成熟的索引服务的情况。 mongoid_fulltext gem可让您在相对较短的字符串中进行模糊字符串搜索，这非常适合根据Rails模型的显示名称填充自动完成框，但不适用于为成千上万HTML文档建立索引。安装此gem的0.6.1或更高版本需要Ruby 1.9.3或更高版本，并且可以与Mongoid 3、4、5和6一起使用。对
所属分类：其它
- 发布日期：2021-03-06
- 文件大小：36864
- 提供者：weixin_42097819

基于n-gram卷积神经网络的MoRF预测
基于n-gram卷积神经网络的MoRF预测
所属分类：其它
- 发布日期：2021-03-02
- 文件大小：338944
- 提供者：weixin_38590790

基于N-Gram模型的蒙古语文本语种识别算法的研究
基于N-Gram模型的蒙古语文本语种识别算法的研究
所属分类：其它
- 发布日期：2021-02-26
- 文件大小：321536
- 提供者：weixin_38666527

textcat：Go包，用于基于n-gram的文本分类，并支持utf-8和原始文本-源码
一个Go包，用于基于n-gram的文本分类，并支持utf-8和原始文本。去做：写文件使它更快关键字：文本分类，语言检测器安装 go get github.com/pebbe/textcat go get github.com/pebbe/textcat/textcat go get github.com/pebbe/textcat/textpat 文件
所属分类：其它
- 发布日期：2021-02-23
- 文件大小：536576
- 提供者：weixin_42146086

基于N-gram语言模型的哈萨克文机构名识别
针对哈萨克文文本中机构名构成特点,提出了一种基于N-gram语言模型的哈萨克文机构名可信度计算方法,并以机构名尾词为触发词,构建了一个哈萨克文机构名识别系统。系统分为训练和识别两个模块,识别过程是:首先从训练语料中提取特征进行训练,得到一个特征训练模型,然后利用训练好的特征模型及少量的附加规则,对测试文本中的机构名进行识别,实验结果表明该方法可行。
所属分类：其它
- 发布日期：2021-02-22
- 文件大小：345088
- 提供者：weixin_38506852

基于N-GRAM的朝鲜文索引方法与性能评价
进行朝鲜文索引时，需要通过分析音节和词素而把名词提取成索引词，但词典中未登录词将造成分析工作的模糊性，从而导致不能进行正确索引。本文基于N-gram有利于分析词典中未登录词的特性，提出一种新的朝鲜文索引方法。通过对比分析和性能评价表明，所提出的方法是有效的。
所属分类：其它
- 发布日期：2021-02-21
- 文件大小：1048576
- 提供者：weixin_38563525

pygrams：从大量文档（> 1000）中提取关键术语（n-gram）并预测出现-源码
工具说明这个基于python的应用程序（ pygrams.py ）旨在从大量（> 1,000）文档pygrams.py自由文本中提取流行或紧急出现的n-gram /术语（单词或短短语）。出于测试目的，包括了已授予专利文件摘要的示例语料库。应用程序管道（用户选项部分中的更多详细信息）：数据可以通过几种文本文档类型（例如，csv，xls，腌制的python数据框等）。这是整个语料库中经过处理的术语（ngram）列表。这些术语是稀疏矩阵的列。用户可以控制以下参数：最小文档频率
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：354418688
- 提供者：weixin_42169971

« 12 3 4 »