您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于P2P的语义检索系统设计

  2. 本文将语义网技术和P2P的优点结合起来,建立P2P网络的语义检索机制。通过建立基于本体概念的分布式倒排索引,使检索过程不再是关键词的精确匹配,而是通过不同节,点本体中的概念之间的语义关系的逻辑推理实现检索请求与文档在语义上的匹配。实验表明,本文提出的结构化P2P网络语义检索方法,比基于关键词精确匹配的检索方法有较高的查全率和查准率。
  3. 所属分类:网络基础

    • 发布日期:2010-10-03
    • 文件大小:429056
    • 提供者:qinzhishan
  1. 倒排索引设计

  2. 倒排索引设计是搜索引擎索引存储结构的基础
  3. 所属分类:专业指导

    • 发布日期:2012-08-28
    • 文件大小:453632
    • 提供者:selg1984
  1. 一种增量倒排索引的设计与实现

  2. 搜索引擎中的倒排索引技术是一个核心的关键技术,如何实现高效的倒排索引一直是各大搜索引擎巨头的核心竞争点。本文是其中的一部分。
  3. 所属分类:C++

    • 发布日期:2013-03-25
    • 文件大小:817152
    • 提供者:ysl1989517
  1. Google_MapReduce中文版-系统架构

  2. MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建 一个Map函数处理一个基于key/value pair的数据集合,输出中间的基于key/value pair的数据集合;然 后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。现实世界中有很多满足 上述处理模型的例子,本论文将详细描述这个模型。 MapReduce架构的程序能够在大量的普通配置的计算机上实现并行化处理。这个系统在运行时只关 心:如何分割输入数据,在大量
  3. 所属分类:其它

    • 发布日期:2013-04-29
    • 文件大小:693248
    • 提供者:yg359547115
  1. 搜易站内搜索引擎

  2. 搜易站内搜索引擎(SearchEasy Site Search Engine)是面向互联网网站的站内搜索解决方案,其针对网站使用数据库搜索性能差,体验差等问题,将搜索引擎技术应用于站内搜索;本系统具备中文分词,智能摘要,关键词高亮等技术,可与数据库无缝集成,目前支持MS SQL 2000/2005,My SQL数据库。 软件基于B/S架构技术,前后端设计精美,操作体验佳。 软件特性: 1,智能中文分词:集成自主研发的面向站内搜索优化的细粒度中文分词充分兼顾搜准率和搜全率; 2,多数据库支持:目
  3. 所属分类:C#

    • 发布日期:2013-05-25
    • 文件大小:1048576
    • 提供者:kwklover
  1. 搜易站内搜索引擎V1.2

  2. 搜易站内搜索引擎(SearchEasy Site Search Engine)是面向互联网网站的站内搜索解决方案,其针对网站使用数据库搜索性能差,体验差等问题,将搜索引擎技术应用于站内搜索;本系统具备中文分词,智能摘要,关键词高亮等技术,可与数据库无缝集成,目前支持MS SQL 2000/2005,My SQL数据库。 软件基于B/S架构技术,前后端设计精美,操作体验佳。 软件特性: 1,智能中文分词:集成自主研发的面向站内搜索优化的细粒度中文分词充分兼顾搜准率和搜全率; 2,多数据库支持:目
  3. 所属分类:C#

    • 发布日期:2013-06-26
    • 文件大小:2097152
    • 提供者:kwklover
  1. 实战Hadoop:开启通向云计算的捷径

  2. 第1章 神奇的大象——Hadoop 1.1 初识神象 1.2 Hadoop初体验 1.2.1 了解Hadoop的构架 1.2.2 查看Hadoop活动 1.3 Hadoop族群 1.4 Hadoop安装 1.4.1 在Linux系统中安装Hadoop 1.4.2 在Windows系统中安装Hadoop 1.4.3 站在象背上说“hello” 1.4.4 Eclipse下的Hadoop应用开发 参考文献 第2章 HDFS——不怕故障的海量存储 2.1 开源的GFS——HDFS 2.1.1 设计前
  3. 所属分类:其它

    • 发布日期:2013-07-31
    • 文件大小:61865984
    • 提供者:jsntghf
  1. lucene原理分析

  2. Lucene作为一个全文检索引擎,其具有如下突出的优点: (1)索引文件格式独立于应用平台。Lucene定义了一套以8位字节为基础的索引文件格式,使得兼容系统或者不同平台的应用能够共享建立的索引文件。 (2)在传统全文检索引擎的倒排索引的基础上,实现了分块索引,能够针对新的文件建立小文件索引,提升索引速度。然后通过与原有索引的合并,达到优化的目的。 (3)优秀的面向对象的系统架构,使得对于Lucene扩展的学习难度降低,方便扩充新功能。 (4)设计了独立于语言和文件格式的文本分析接口,索引器通
  3. 所属分类:其它

    • 发布日期:2013-11-29
    • 文件大小:4194304
    • 提供者:u010747123
  1. 面向美食网站的搜索及点评与图片去重模块的设计与实现

  2. 本课题所研究的内容是某美食类网站关于图片,内容的处理以及垂直搜索 的问题。对于图片处理,简单来说是图片的匹配,采用匹配算法过滤出重复的 图片然后根据匹配数据采取不同的操作。该问题通过建立数据库存储原来的图 片信息,使用颜色直方图生成算法生成对应的颜色直方图并用距离向量算法计 算图片的相似度数据来实现。内容处理问题即点评处理,该问题与图片处理类 似,通过中文分词算法对点评内容进行分词,然后根据规则对待匹配的内容进 行排序,最后进行匹配操作计算匹配度。垂直搜索问题即针对美食类的信息进 行专项搜索,
  3. 所属分类:PHP

  1. Hadoop应用开发实战详解源代码

  2. Hadoop应用开发实战详解源代码  第4章 初识MapReduce   4.1 MapReduce简介     4.1.1 MapReduce要解决什么问题     4.1.2 MapReduce的理论基础     4.1.3 MapReduce的编程模式    4.2 MapReduce的集群行为    4.3 Map/Reduce框架    4.4 样例分析:单词计数     4.4.1 WordCount实例的运行过程     4.4.2 WordCount的源码分析和程序处理过程 
  3. 所属分类:Java

    • 发布日期:2015-05-25
    • 文件大小:202752
    • 提供者:syilo
  1. 文档倒排索引的MapReduce程序设计与实现

  2. 文档倒排索引的MapReduce程序设计与实现
  3. 所属分类:讲义

    • 发布日期:2015-09-22
    • 文件大小:551936
    • 提供者:dongdongup
  1. 程序员编程艺术:面试和算法心得.pdf

  2. 第一部分 数据结构 • • • 第一章 字符串 o 1.0 本章导读 o 1.1 旋转字符串 o 1.2 字符串包含 o 1.3 字符串转换成整数 o 1.4 回文判断 o 1.5 最长回文子串 o 1.6 字符串的全排列 o 1.10 本章习题 第二章 数组 o 2.0 本章导读 o 2.1 寻找最小的 k 个数 o 2.2 寻找和为定值的两个数 o 2.3 寻找和为定值的多个数 o 2.4 最大连续子数组和 o 2.5 跳台阶 o 2.6 奇偶排序 o 2.7 荷兰国旗 o 2.8 矩阵相
  3. 所属分类:C

    • 发布日期:2017-11-16
    • 文件大小:4194304
    • 提供者:xjj7540916
  1. lucene搜索引擎【代码以及jar包】

  2. Lucene作为一个全文检索引擎,其具有如下突出的优点:   (1)索引文件格式独立于应用平台。Lucene定义了一套以8位字节为基础的索引文件格式,使得兼容系统或者不同平台的应用能够共享建立的索引文件。   (2)在传统全文检索引擎的倒排索引的基础上,实现了分块索引,能够针对新的文件建立小文件索引,提升索引速度。然后通过与原有索引的合并,达到优化的目的。   (3)优秀的面向对象的系统架构,使得对于Lucene扩展的学习难度降低,方便扩充新功能。   (4)设计了独立于语言和文件格式的文本分
  3. 所属分类:Java

    • 发布日期:2009-02-06
    • 文件大小:1048576
    • 提供者:chickenlove
  1. C++网络爬虫项目

  2. WEBCRAWLER 网络爬虫实训项目 1 WEBCRAWLER 网 络 爬 虫 实 训 项 目 文档版本: 1.0.0.1 编写单位: 达内IT培训集团 C++教学研发部 编写人员: 闵卫 定稿日期: 2015年11月20日 星期五WEBCRAWLER 网络爬虫实训项目 2 1. 项目概述 互联网产品形形色色,有产品导向的,有营销导向的,也有技术导向的,但是 以技术见长的互联网产品比例相对小些。搜索引擎是目前互联网产品中最具技 术含量的产品,如果不是唯一,至少也是其中之一。 经过十几年的发展
  3. 所属分类:C/C++

    • 发布日期:2018-07-04
    • 文件大小:4194304
    • 提供者:qq15690515
  1. 新版Hadoop视频教程 段海涛老师Hadoop八天完全攻克Hadoop视频教程 Hadoop开发

  2. 第一天 hadoop的基本概念 伪分布式hadoop集群安装 hdfs mapreduce 演示 01-hadoop职位需求状况.avi 02-hadoop课程安排.avi 03-hadoop应用场景.avi 04-hadoop对海量数据处理的解决思路.avi 05-hadoop版本选择和伪分布式安装.avi 06-hadoop版本选择和伪分布式安装2.avi 07-hdfs&mapreduce;测试.avi 08-hdfs的实现机制初始.avi 09-hdfs的shell操作.avi 10-
  3. 所属分类:Java

    • 发布日期:2018-07-20
    • 文件大小:226
    • 提供者:jintaocccq
  1. ElasticSearch分布式全文检索入门视频教程

  2. ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。 我们建立一个网站或应用程序,并要添加搜索功能,令我们受打击的是:搜索工作是很难的。我们希望我们的搜索解决方案要快,我们希望有一个零配置和一个完全免费的搜索模式,我们希望能够
  3. 所属分类:其它

    • 发布日期:2018-02-11
    • 文件大小:188
    • 提供者:u013844840
  1. 管理海量数据-压缩、索引和查询 第2版.zip

  2. 第1章 概览 1.1 文档数据库(document databases) 1.2 压缩(compression) 1.3 索引(indexes) 1.4 文档索引 1.5 MG海量文档管理系统 第2章 文本压缩 2.1 模型 2.2 自适应模型 2.3 哈夫曼编码 范式哈夫曼编码 计算哈夫曼编码长度 总结 2.4 算术编码 算术编码是如何工作的 实现算术编码 保存累积计数 2.5 符号模型 部分匹配预测 块排序压缩 动态马尔科夫压缩 基于单字的压缩 2.6 字典模型 自适应字典编码器的LZ77
  3. 所属分类:数据库

    • 发布日期:2019-08-04
    • 文件大小:236978176
    • 提供者:harlensaint
  1. solr千亿检索设计说明.zip

  2. 基于solr实现的千亿级检索设计说明。solr中国沙龙!对底层的lucene结构做了说明,使用了倒排索引的技术
  3. 所属分类:Java

    • 发布日期:2020-01-22
    • 文件大小:506880
    • 提供者:mrjanggd
  1. 基于10000网页python搭建搜索引擎课程设计

  2. 10000网页简单上手,代码和配置环境全部写好,傻瓜式操作。 执行文件顺序是 1.Spider.py进行爬取网页并分析 2.index.py生成倒排索引,idf文件 3.app.py运行搜索引擎 4.在默认浏览器输入 http://localhost:8080/ 进行检索 若要使用数据库 1.writeDB.py写倒排索引与idf(时间较长) 2.可以在summary.py切换from DB_search import s使用数据库 注意: 还需要停用词是stopw
  3. 所属分类:Python

    • 发布日期:2020-01-07
    • 文件大小:129024
    • 提供者:qq_30007953
  1. 华中科技大学计算机学院Java程序设计实验一源码及报告.zip

  2. 华中科技大学计算机学院Java程序设计实验,实验一,基于内存的倒排索引,内含源码、文档及报告---
  3. 所属分类:互联网

    • 发布日期:2020-08-12
    • 文件大小:13631488
    • 提供者:qq_41415906
« 12 »