搜索资源 - Hadoop下的分布式搜索引擎 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - Hadoop下的分布式搜索引擎

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

Hadoop开发者第二期
众所周知，Nutch和hadoop 本是一家，从0.X版本开始，Hadoop从Nutch中剥离出来成为一个开源子项目，Hadoop的初衷是为解决Nutch的海量数据爬取和存储的需要。相信Hadoop的fans都很清楚，Hadoop 其实并非一个单纯用于存储的分布式文件系统，而是一个被设计用来在由普通硬件设备组成的大型集群上执行分布式应用的框架（Framework）。Hadoop 包含两个部分：一个分布式文件系统 HDFS (Hadoop Distributed File System)，和一个
所属分类：其它
- 发布日期：2010-05-27
- 文件大小：2097152
- 提供者：loveukyo

基于lucene和nutch的开源搜索引擎资料集合
其中内容均为前段时间研究开源搜索引擎时搜集参考的资料，非常齐全包含的内容有： Computing PageRank Using Hadoop.ppt Google的秘密PageRank彻底解说中文版.doc JAVA_Lucene_in_Action教程完整版.doc Java开源搜索引擎.doc Linux下Nutch分布式配置和使用.pdf Lucene+Nutch源码.rar Lucene学习笔记.doc nutch_tutorial.pdf nutch二次开发总结.txt nutch入
所属分类：Java
- 发布日期：2011-01-19
- 文件大小：5242880
- 提供者：greatman4551

Hadoop下的分布式搜索引擎
引言互联网的高速发展使Internet上信息数量呈几何式增长。现有的集中式搜索引擎从如此海量的信息中快速检索出真正需要的信息正变得越来越困难，所以搜索引擎系统应具有分布式处理能力，能根据需要处理信息的增长，不断地扩展系统规模以增强系统处理信息的能力。因此，构建分布式搜索引擎就变得非常有意义了。本文首先分析了Map/Reduce编程模型运行原理及其优点，其次介绍了Map/Reduce模型的开源实现版本——Hadoop分布式处理平台，在此基础上将搜索引擎的爬行器、索引器和查询器
所属分类：Java
- 发布日期：2011-04-29
- 文件大小：1048576
- 提供者：lionfromasia

Hadoop下的分布式搜索引擎
分析了hadoop系统结构,使用 Hadoop框架能够设计出具有高性能、高可靠性和易扩展性的分布式搜索引擎
所属分类：其它
- 发布日期：2011-10-12
- 文件大小：1048576
- 提供者：wudao7

Hadoop下的分布式搜索引擎
Hadoop下的分布式搜索引擎Hadoop下的分布式搜索引擎
所属分类：Java
- 发布日期：2011-11-23
- 文件大小：380928
- 提供者：liangxiao_2011

Hadoop下的分布式搜索引擎
Hadoop下的分布式搜索引擎
所属分类：Java
- 发布日期：2013-03-05
- 文件大小：1048576
- 提供者：fengzhe0411

Hadoop+Hbase搭建云存储总结
Hadoop文件系统：Hadoop文件系统是一个能够兼容普通硬件环境的分布式文件系统，和现有的分布式文件系统不同的地方是Hadoop更注重容错性和兼容廉价的硬件设备，这样做是为了用很小的预算甚至直接利用现有机器就实现大流量和大数据量的读取。Hadoop使用了POSIX的设计来实现对文件系统文件流的读取。HDFS（Hadoop FileSystem）原来是Apache Nutch搜索引擎（从Lucene发展而来）开发的一个部分，后来独立出来作为一个Apache子项目。Hadoop的假设与目标：硬
所属分类：其它
- 发布日期：2013-04-19
- 文件大小：118784
- 提供者：kongxinqi

Hadoop下的分布式搜索引擎
Hadoop 系统结构，提出一种改进的 PageRank 算法，使用 Map/Reduce 模式设计系统模块。实验证明，使用 Hadoop 框架能够设计出具有高性能、高可靠性和易扩展性的分布式搜索引擎
所属分类：Java
- 发布日期：2013-04-26
- 文件大小：1048576
- 提供者：q1984201234

Hadoop 教程
教程内容第一章 Hadoop HadoopHadoopHadoop的起源于体系介绍的起源于体系介绍的起源于体系介绍的起源于体系介绍的起源于体系介绍的起源于体系介绍的起源于体系介绍 Hadoop adoop 学习目标学习目标：map/reducemap/reduce map/reducemap/reduce 编程，编程， pig pig，HbaseHbase Hbase、HiveHiveHiveHive的安装与使用等。的安装与使用等。的安装与使用等。 Hadoop ado
所属分类：其它
- 发布日期：2013-07-29
- 文件大小：344064
- 提供者：liulangchina

实战Hadoop：开启通向云计算的捷径
第1章神奇的大象——Hadoop 1.1 初识神象 1.2 Hadoop初体验 1.2.1 了解Hadoop的构架 1.2.2 查看Hadoop活动 1.3 Hadoop族群 1.4 Hadoop安装 1.4.1 在Linux系统中安装Hadoop 1.4.2 在Windows系统中安装Hadoop 1.4.3 站在象背上说“hello” 1.4.4 Eclipse下的Hadoop应用开发参考文献第2章 HDFS——不怕故障的海量存储 2.1 开源的GFS——HDFS 2.1.1 设计前
所属分类：其它
- 发布日期：2013-07-31
- 文件大小：61865984
- 提供者：jsntghf

Hadoop下的分布式搜索引擎
Hadoop下的分布式搜索引擎，集群化检索
所属分类：群集服务
- 发布日期：2015-04-15
- 文件大小：1048576
- 提供者：lw163com

网站架构技术
大型网站架构演化大型网站软件系统的特点大型网站架构演化发展历程初始阶段应用服务和数据服务分离使用缓存改善网站性能缓存类型本地缓存分布式缓存缓存产品 redis 业界主流 memcached 解决问题数据库访问使用应用服务器集群改善网站的并发处理能力问题: 负载均衡情况下session状态的保持? 解决方案: 基于DNS的负载均衡反向代理 ngix JK2 数据库的读写分离问题: 读库与写库的数据同步解决方案: 不同的数据库都有自己的数据库的主从复制功能使用反向代
所属分类：专业指导
- 发布日期：2016-10-09
- 文件大小：1048576
- 提供者：qq_33220449

大型分布式网站架构与实践
第1章　面向服务的体系架构（SOA） 1 　　本章主要介绍和解决以下问题，这些也是全书的基础：　　HTTP协议的工作方式与HTTP网络协议栈的结构。　　如何实现基于HTTP协议和TCP协议的RPC调用，它们之间有何差别，分别适应何种场景。　　如何实现服务的动态注册和路由，以及软负载均衡的实现。　　1.1　基于TCP协议的RPC 3 　　1.1.1　RPC名词解释 3 　　1.1.2　对象的序列化 4 　　1.1.3　基于TCP协议实现RPC 6 　　1.2　基于HTTP协议的RPC 9
所属分类：Java
- 发布日期：2018-08-24
- 文件大小：96468992
- 提供者：mr_hope

Apache Hadoop---Elasticsearch.docx
Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口。Elasticsearch是用Java语言开发的，并作为Apache许可条款下的开放源码发布，是一种流行的企业级搜索引擎。Elasticsearch用于云计算中，能够达到实时搜索，稳定，可靠，快速，安装使用方便。官方客户端在Java、.NET（C#）、PHP、Python、Apache Groovy、Ruby和许多其他语言中都是可用的。根据DB-Engines
所属分类：Hadoop
- 发布日期：2020-06-11
- 文件大小：442368
- 提供者：qq_31641743