搜索资源 - 倒排索引设计 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 倒排索引设计

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

基于P2P的语义检索系统设计
本文将语义网技术和P2P的优点结合起来，建立P2P网络的语义检索机制。通过建立基于本体概念的分布式倒排索引，使检索过程不再是关键词的精确匹配，而是通过不同节，点本体中的概念之间的语义关系的逻辑推理实现检索请求与文档在语义上的匹配。实验表明，本文提出的结构化P2P网络语义检索方法，比基于关键词精确匹配的检索方法有较高的查全率和查准率。
所属分类：网络基础
- 发布日期：2010-10-03
- 文件大小：429056
- 提供者：qinzhishan

倒排索引设计
倒排索引设计是搜索引擎索引存储结构的基础
所属分类：专业指导
- 发布日期：2012-08-28
- 文件大小：453632
- 提供者：selg1984

一种增量倒排索引的设计与实现
搜索引擎中的倒排索引技术是一个核心的关键技术，如何实现高效的倒排索引一直是各大搜索引擎巨头的核心竞争点。本文是其中的一部分。
所属分类：C++
- 发布日期：2013-03-25
- 文件大小：817152
- 提供者：ysl1989517

Google_MapReduce中文版-系统架构
MapReduce是一个编程模型，也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于key/value pair的数据集合，输出中间的基于key/value pair的数据集合；然后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。现实世界中有很多满足上述处理模型的例子，本论文将详细描述这个模型。 MapReduce架构的程序能够在大量的普通配置的计算机上实现并行化处理。这个系统在运行时只关心：如何分割输入数据，在大量
所属分类：其它
- 发布日期：2013-04-29
- 文件大小：693248
- 提供者：yg359547115

搜易站内搜索引擎
搜易站内搜索引擎（SearchEasy Site Search Engine）是面向互联网网站的站内搜索解决方案，其针对网站使用数据库搜索性能差，体验差等问题，将搜索引擎技术应用于站内搜索；本系统具备中文分词，智能摘要，关键词高亮等技术，可与数据库无缝集成，目前支持MS SQL 2000/2005，My SQL数据库。软件基于B/S架构技术，前后端设计精美，操作体验佳。软件特性： 1，智能中文分词：集成自主研发的面向站内搜索优化的细粒度中文分词充分兼顾搜准率和搜全率； 2，多数据库支持：目
所属分类：C#
- 发布日期：2013-05-25
- 文件大小：1048576
- 提供者：kwklover

搜易站内搜索引擎V1.2
搜易站内搜索引擎（SearchEasy Site Search Engine）是面向互联网网站的站内搜索解决方案，其针对网站使用数据库搜索性能差，体验差等问题，将搜索引擎技术应用于站内搜索；本系统具备中文分词，智能摘要，关键词高亮等技术，可与数据库无缝集成，目前支持MS SQL 2000/2005，My SQL数据库。软件基于B/S架构技术，前后端设计精美，操作体验佳。软件特性： 1，智能中文分词：集成自主研发的面向站内搜索优化的细粒度中文分词充分兼顾搜准率和搜全率； 2，多数据库支持：目
所属分类：C#
- 发布日期：2013-06-26
- 文件大小：2097152
- 提供者：kwklover

实战Hadoop：开启通向云计算的捷径
第1章神奇的大象——Hadoop 1.1 初识神象 1.2 Hadoop初体验 1.2.1 了解Hadoop的构架 1.2.2 查看Hadoop活动 1.3 Hadoop族群 1.4 Hadoop安装 1.4.1 在Linux系统中安装Hadoop 1.4.2 在Windows系统中安装Hadoop 1.4.3 站在象背上说“hello” 1.4.4 Eclipse下的Hadoop应用开发参考文献第2章 HDFS——不怕故障的海量存储 2.1 开源的GFS——HDFS 2.1.1 设计前
所属分类：其它
- 发布日期：2013-07-31
- 文件大小：61865984
- 提供者：jsntghf

lucene原理分析
Lucene作为一个全文检索引擎，其具有如下突出的优点：（1）索引文件格式独立于应用平台。Lucene定义了一套以8位字节为基础的索引文件格式，使得兼容系统或者不同平台的应用能够共享建立的索引文件。（2）在传统全文检索引擎的倒排索引的基础上，实现了分块索引，能够针对新的文件建立小文件索引，提升索引速度。然后通过与原有索引的合并，达到优化的目的。（3）优秀的面向对象的系统架构，使得对于Lucene扩展的学习难度降低，方便扩充新功能。（4）设计了独立于语言和文件格式的文本分析接口，索引器通
所属分类：其它
- 发布日期：2013-11-29
- 文件大小：4194304
- 提供者：u010747123

面向美食网站的搜索及点评与图片去重模块的设计与实现
本课题所研究的内容是某美食类网站关于图片，内容的处理以及垂直搜索的问题。对于图片处理，简单来说是图片的匹配，采用匹配算法过滤出重复的图片然后根据匹配数据采取不同的操作。该问题通过建立数据库存储原来的图片信息，使用颜色直方图生成算法生成对应的颜色直方图并用距离向量算法计算图片的相似度数据来实现。内容处理问题即点评处理，该问题与图片处理类似，通过中文分词算法对点评内容进行分词，然后根据规则对待匹配的内容进行排序，最后进行匹配操作计算匹配度。垂直搜索问题即针对美食类的信息进行专项搜索，
所属分类：PHP
- 发布日期：2014-09-14
- 文件大小：1048576
- 提供者：zhoutao1993allen

Hadoop应用开发实战详解源代码
Hadoop应用开发实战详解源代码　第4章　初识MapReduce 　　4.1　MapReduce简介　　　　4.1.1　MapReduce要解决什么问题　　　　4.1.2　MapReduce的理论基础　　　　4.1.3　MapReduce的编程模式　　　4.2　MapReduce的集群行为　　　4.3　Map/Reduce框架　　　4.4　样例分析：单词计数　　　　4.4.1　WordCount实例的运行过程　　　　4.4.2　WordCount的源码分析和程序处理过程　
所属分类：Java
- 发布日期：2015-05-25
- 文件大小：202752
- 提供者：syilo

文档倒排索引的MapReduce程序设计与实现
文档倒排索引的MapReduce程序设计与实现
所属分类：讲义
- 发布日期：2015-09-22
- 文件大小：551936
- 提供者：dongdongup

程序员编程艺术：面试和算法心得.pdf
第一部分数据结构 • • • 第一章字符串 o 1.0 本章导读 o 1.1 旋转字符串 o 1.2 字符串包含 o 1.3 字符串转换成整数 o 1.4 回文判断 o 1.5 最长回文子串 o 1.6 字符串的全排列 o 1.10 本章习题第二章数组 o 2.0 本章导读 o 2.1 寻找最小的 k 个数 o 2.2 寻找和为定值的两个数 o 2.3 寻找和为定值的多个数 o 2.4 最大连续子数组和 o 2.5 跳台阶 o 2.6 奇偶排序 o 2.7 荷兰国旗 o 2.8 矩阵相
所属分类：C
- 发布日期：2017-11-16
- 文件大小：4194304
- 提供者：xjj7540916

lucene搜索引擎【代码以及jar包】
Lucene作为一个全文检索引擎，其具有如下突出的优点：　　（1）索引文件格式独立于应用平台。Lucene定义了一套以8位字节为基础的索引文件格式，使得兼容系统或者不同平台的应用能够共享建立的索引文件。　　（2）在传统全文检索引擎的倒排索引的基础上，实现了分块索引，能够针对新的文件建立小文件索引，提升索引速度。然后通过与原有索引的合并，达到优化的目的。　　（3）优秀的面向对象的系统架构，使得对于Lucene扩展的学习难度降低，方便扩充新功能。　　（4）设计了独立于语言和文件格式的文本分
所属分类：Java
- 发布日期：2009-02-06
- 文件大小：1048576
- 提供者：chickenlove

C++网络爬虫项目
WEBCRAWLER 网络爬虫实训项目 1 WEBCRAWLER 网络爬虫实训项目文档版本： 1.0.0.1 编写单位：达内IT培训集团 C++教学研发部编写人员：闵卫定稿日期： 2015年11月20日星期五WEBCRAWLER 网络爬虫实训项目 2 1. 项目概述互联网产品形形色色，有产品导向的，有营销导向的，也有技术导向的，但是以技术见长的互联网产品比例相对小些。搜索引擎是目前互联网产品中最具技术含量的产品，如果不是唯一，至少也是其中之一。经过十几年的发展
所属分类：C/C++
- 发布日期：2018-07-04
- 文件大小：4194304
- 提供者：qq15690515

新版Hadoop视频教程段海涛老师Hadoop八天完全攻克Hadoop视频教程 Hadoop开发
第一天 hadoop的基本概念伪分布式hadoop集群安装 hdfs mapreduce 演示 01-hadoop职位需求状况.avi 02-hadoop课程安排.avi 03-hadoop应用场景.avi 04-hadoop对海量数据处理的解决思路.avi 05-hadoop版本选择和伪分布式安装.avi 06-hadoop版本选择和伪分布式安装2.avi 07-hdfs&mapreduce;测试.avi 08-hdfs的实现机制初始.avi 09-hdfs的shell操作.avi 10-
所属分类：Java
- 发布日期：2018-07-20
- 文件大小：226
- 提供者：jintaocccq

ElasticSearch分布式全文检索入门视频教程
ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口。Elasticsearch是用Java开发的，并作为Apache许可条款下的开放源码发布，是当前流行的企业级搜索引擎。设计用于云计算中，能够达到实时搜索，稳定，可靠，快速，安装使用方便。我们建立一个网站或应用程序，并要添加搜索功能，令我们受打击的是：搜索工作是很难的。我们希望我们的搜索解决方案要快，我们希望有一个零配置和一个完全免费的搜索模式，我们希望能够
所属分类：其它
- 发布日期：2018-02-11
- 文件大小：188
- 提供者：u013844840

管理海量数据-压缩、索引和查询第2版.zip
第1章概览 1.1 文档数据库（document databases） 1.2 压缩（compression） 1.3 索引（indexes） 1.4 文档索引 1.5 MG海量文档管理系统第2章文本压缩 2.1 模型 2.2 自适应模型 2.3 哈夫曼编码范式哈夫曼编码计算哈夫曼编码长度总结 2.4 算术编码算术编码是如何工作的实现算术编码保存累积计数 2.5 符号模型部分匹配预测块排序压缩动态马尔科夫压缩基于单字的压缩 2.6 字典模型自适应字典编码器的LZ77
所属分类：数据库
- 发布日期：2019-08-04
- 文件大小：236978176
- 提供者：harlensaint

solr千亿检索设计说明.zip
基于solr实现的千亿级检索设计说明。solr中国沙龙!对底层的lucene结构做了说明，使用了倒排索引的技术
所属分类：Java
- 发布日期：2020-01-22
- 文件大小：506880
- 提供者：mrjanggd

基于10000网页python搭建搜索引擎课程设计
10000网页简单上手，代码和配置环境全部写好，傻瓜式操作。执行文件顺序是 1.Spider.py进行爬取网页并分析 2.index.py生成倒排索引，idf文件 3.app.py运行搜索引擎 4.在默认浏览器输入 http://localhost:8080/ 进行检索若要使用数据库 1.writeDB.py写倒排索引与idf(时间较长) 2.可以在summary.py切换from DB_search import s使用数据库注意：还需要停用词是stopw
所属分类：Python
- 发布日期：2020-01-07
- 文件大小：129024
- 提供者：qq_30007953

华中科技大学计算机学院Java程序设计实验一源码及报告.zip
华中科技大学计算机学院Java程序设计实验，实验一，基于内存的倒排索引，内含源码、文档及报告---
所属分类：互联网
- 发布日期：2020-08-12
- 文件大小：13631488
- 提供者：qq_41415906

« 12 »