您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Lucene 原理 介绍

  2. Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下:...
  3. 所属分类:其它

    • 发布日期:2009-05-12
    • 文件大小:2048
    • 提供者:zhuansky008
  1. 全文检索技术研究与应用论文

  2. 全文检索是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一。本文对中文全文检索的有关技术进行了较为深入的研究。在基于字表的全文索引方面,本文提出了一种改进的倒排索引结构,同传统索引结构相比,更便于索引的构建、维护、更新。本文的重点放在了全文检索技术的应用上,对如何利用新技术、改善检索系统的结构、提高检索系统的性能和效率、加快检速度、不断适应网络信息发展等方面做了重点研究。
  3. 所属分类:网络基础

    • 发布日期:2009-06-29
    • 文件大小:123904
    • 提供者:java_zhu
  1. FAST-INV-A Fast Algorithm for building large inverted files

  2. 本文档详细的介绍了一种用于搜索技术中的快速建立倒排文件的算法
  3. 所属分类:其它

    • 发布日期:2008-02-25
    • 文件大小:1048576
    • 提供者:benchung
  1. 信息检索 倒排索引

  2. 编写程序实现为给定目录下txt文件建立倒排索引文件il.txt 运行后会自动生成 1.txt,2.txt,4.txt,其中 1.txt,2.txt需要你自己输入需要排序的文档(如莎士比亚的文集),排序结果输出在il.txt中
  3. 所属分类:C/C++

    • 发布日期:2014-04-02
    • 文件大小:7168
    • 提供者:u011332819
  1. 基于hadoop搜索引擎 离线处理程序

  2. 本项目是基于hadoop搜索引擎的离线处理程序,主要包含三部分 1.网页信息过滤 2.生成倒排索引文件 3.生成二级索引文件;
  3. 所属分类:Java

    • 发布日期:2014-10-20
    • 文件大小:31457280
    • 提供者:long1657
  1. spimi算法的c++实现倒排索引器并gamma编码压缩

  2. spimi算法实现的倒排索引的构建,并且对倒排索引进行了Gamma编码压缩,对词典进行了单一字符串压缩,分别写入了二进制的倒排索引文件和词典文件
  3. 所属分类:C++

    • 发布日期:2015-01-10
    • 文件大小:553984
    • 提供者:longmenwaideyu
  1. 倒排索引表

  2. 倒排索引的实现。 一个文件含有几个文件的名字,打开这个文件之后读其他文件的内容,将内容出现的文件号输出。
  3. 所属分类:Unix

    • 发布日期:2016-02-09
    • 文件大小:2048
    • 提供者:qq_14862095
  1. java实现倒排索引表的布尔查询

  2. java实现读取多个文件构成hashmap创建倒排索引表,然后实现布尔查询. 代码比较丑陋,初学者写的。多多包涵!
  3. 所属分类:Java

    • 发布日期:2016-04-01
    • 文件大小:6144
    • 提供者:jerry__j
  1. 信息检索-索引的建立作业

  2. 信息检索,基本索引的建立,包括对歌词文件的,读取单词,排序,建立倒排缩影的全部过程,整个过程都有详细的流程说明,附加文档说明喔!
  3. 所属分类:互联网

    • 发布日期:2016-11-11
    • 文件大小:25600
    • 提供者:qq_28410301
  1. JAVA倒排索引及JSP网页显示

  2. 完整的以lucene为基础架构的倒排索引建立以及JSP显示。部分爬虫文件目录请自行爬取创建
  3. 所属分类:Java

    • 发布日期:2017-06-02
    • 文件大小:1048576
    • 提供者:li201400130091
  1. 简单的Hadoop分区和倒排索引示例

  2. 简单的Hadoop分区和倒排索引示例,需要有Hadoop分布式环境支撑。分区案例功能:分析通讯录文件,统计员工和科长的个数 根据职级分区,员工放一个文件,科长放一个文件。MyEclipse项目可以直接导入。
  3. 所属分类:Hadoop

    • 发布日期:2017-11-21
    • 文件大小:25600
    • 提供者:xywan
  1. MapReduce倒排索引代码

  2. 倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(inverted index)。带有倒排索引的文件我们称为倒排索引文件,简称倒排文件(inverted file)。
  3. 所属分类:Hadoop

    • 发布日期:2019-03-14
    • 文件大小:6144
    • 提供者:lucia320
  1. 山东大学 大数据实验二 倒排索引算法Java实现

  2. 山东大学大数据课程的实验二。基于hadoop集群系统(也可以在伪分布式系统上运行)系统使用Java编写的倒排索引实现,具有使用停词表功能,使用正则表达式选择规范的单词。代码重构了setup(),map(),combiner(),partitation()和reducer()函数,功能是对文档进行倒排索引,得到一个单词有序,且单词的文件列表同样有序的倒排列表集合。
  3. 所属分类:Hadoop

    • 发布日期:2019-04-21
    • 文件大小:6144
    • 提供者:qq_37665301
  1. MapReduce实现倒排索引-可运行的jar包

  2. 运行说明:在linux终端输入 $ hadoop jar test-1.0-SNAPSHOT.jar WordCount /input/* /MyOutput1/ 后两个参数是hdfs上面【输入】的文本文件目录和【输出】目录。 记得清空输出目录。
  3. 所属分类:Hadoop

    • 发布日期:2020-05-24
    • 文件大小:6144
    • 提供者:weixin_43977129
  1. Python倒排索引之查找包含某主题或单词的文件

  2. 倒排索引(英语:Inverted index),也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。这篇文章主要介绍了Python倒排索引之查找包含某主题或单词的文件,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-18
    • 文件大小:152576
    • 提供者:weixin_38603259
  1. 基于倒排索引的多维网络存储模型

  2. 具有多维属性的实体相互连接构成的网络(如社交网络)称为多维网络,在多维网络上支持联机分析处理具有重。要的应用价值现有方法大都从文件或数据库中逐条读取记录,当数据量很大时,需要多次读取磁盘,导致查询响应时间。过长,效率提高文中提出了一种新的基于倒排索引的多维网络存储模型II-GC(InvertedIndexbasedGraphCube),通过。将图的非线性结构和顶点的多维属性存储在倒排索引列表中的快速查询速度,并在多维网络上进行聚集查询(cuboid)。和交叉查询(crossboid)的算法在DB
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:373760
    • 提供者:weixin_38664427
  1. ask-answer-system:简单的问答系统实现,利用TF-IDF,词向量,倒排表等方法-源码

  2. 问-答系统 简单的问答系统实现,利用TF-IDF,词向量,倒排表等方法 数据集 综合类中文词库.xlsx:包含了中文词,当做字典来用(用作PART1) dev-v2.0.json:这个数据包含了问题和答案的对,但是以JSON格式存在,需要编写parser来提取出里面的问题和答案。 手套。6B:这个文件需要从网上下载,下载地址为: ://nlp.stanford.edu/projects/glove/,请使用d = 100的单词向量(用于PART3) 环境: Python 3(必须要使用P
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:18874368
    • 提供者:weixin_42134094
  1. SearchingSystem:python实现的基于倒排索引和向量空间模型实现的信息检索系统-源码

  2. 信息检索系统 利用倒排索引和向量空间模型实现的信息检索系统。 完成工作: 带位置信息的倒排索引 转化空间模型 TOP K查询 BOOL查询 初步查询 拼写矫正 名词查询 拼写矫正(以下) 运行 环境要求:python3 在初次运行程序前请下载词干还原依赖的语料库 在SearchSystem/main.py中已经注释掉下载语料库的命令 nltk . download ( "wordnet" ) nltk . download ( "averaged_perceptron_tagger" ) nlt
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:68157440
    • 提供者:weixin_42144554
  1. Python倒排索引之查找包含某主题或单词的文件

  2. 什么是倒排索引? 倒排索引(英语:Inverted index),也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。通过倒排索引,可以根据单词快速获取包含这个单词的文档列表。倒排索引主要由两个部分组成:“单词词典”和“倒排文件”。 假设我们现在有文件: test1.txt中存有:我们爱自然语言处理 test2.txt中存有:我们爱计算机视觉 正向索引: {“test1.txt”:[“
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:154624
    • 提供者:weixin_38516706
  1. Hadoop编程基于MR程序实现倒排索引示例

  2. 相信接触过搜索引擎开发的同学对倒排索引并不陌生,谷歌、百度等搜索引擎都是用的倒排索引,关于倒排索引的有关知识,这里就不再深入讲解,有兴趣的同学到网上了解一下。这篇博文就带着大家一起学习下如何利用Hadoop的MR程序来实现倒排索引的功能。 一、数据准备 1、输入文件数据 这里我们准备三个输入文件,分别如下所示 a.txt hello tom hello jerry hello tom b.txt hello jerry hello jerry tom jerry c.txt he
  3. 所属分类:其它

    • 发布日期:2021-01-09
    • 文件大小:62464
    • 提供者:weixin_38607282
« 12 3 4 5 6 »