您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Hadoop开发者第二期

  2. 众所周知,Nutch和hadoop 本是一家,从0.X版本开始,Hadoop从Nutch中剥离出来成为一个开源子项目,Hadoop的初衷是为解决Nutch的海量数据爬取和存储的需要。相信Hadoop的fans都很清楚,Hadoop 其实并非一个单纯用于存储的分布式文件系统,而是一个被设计用来在由普通硬件设备组成的大型集群上执行分布式应用的框架(Framework)。Hadoop 包含两个部分:一个分布式文件系统 HDFS (Hadoop Distributed File System),和一个
  3. 所属分类:其它

    • 发布日期:2010-05-27
    • 文件大小:2097152
    • 提供者:loveukyo
  1. 基于lucene和nutch的开源搜索引擎资料集合

  2. 其中内容均为前段时间研究开源搜索引擎时搜集参考的资料,非常齐全包含的内容有: Computing PageRank Using Hadoop.ppt Google的秘密PageRank彻底解说中文版.doc JAVA_Lucene_in_Action教程完整版.doc Java开源搜索引擎.doc Linux下Nutch分布式配置和使用.pdf Lucene+Nutch源码.rar Lucene学习笔记.doc nutch_tutorial.pdf nutch二次开发总结.txt nutch入
  3. 所属分类:Java

    • 发布日期:2011-01-19
    • 文件大小:5242880
    • 提供者:greatman4551
  1. Hadoop下的分布式搜索引擎

  2. 引言 互联网的高速发展使Internet上信息数量呈几何式 增长。现有的集中式搜索引擎从如此海量的信息中快速检 索出真正需要的信息正变得越来越困难,所以搜索引擎系 统应具有分布式处理能力,能根据需要处理信息的增长, 不断地扩展系统规模以增强系统处理信息的能力。因此, 构建分布式搜索引擎就变得非常有意义了。本文首先分析 了Map/Reduce编程模型运行原理及其优点,其次介绍 了Map/Reduce模型的开源实现版本——Hadoop分布 式处理平台,在此基础上将搜索引擎的爬行器、索引器和 查询器
  3. 所属分类:Java

    • 发布日期:2011-04-29
    • 文件大小:1048576
    • 提供者:lionfromasia
  1. Hadoop下的分布式搜索引擎

  2. 分析了hadoop系统结构,使用 Hadoop框架能够设计出具有高性能、高可靠性和易扩展性的分布式搜索引擎
  3. 所属分类:其它

    • 发布日期:2011-10-12
    • 文件大小:1048576
    • 提供者:wudao7
  1. Hadoop下的分布式搜索引擎

  2. Hadoop下的分布式搜索引擎Hadoop下的分布式搜索引擎
  3. 所属分类:Java

    • 发布日期:2011-11-23
    • 文件大小:380928
    • 提供者:liangxiao_2011
  1. Hadoop下的分布式搜索引擎

  2. Hadoop下的分布式搜索引擎
  3. 所属分类:Java

    • 发布日期:2013-03-05
    • 文件大小:1048576
    • 提供者:fengzhe0411
  1. Hadoop+Hbase搭建云存储总结

  2. Hadoop文件系统:Hadoop文件系统是一个能够兼容普通硬件环境的分布式文件系统,和现有的分布式文件系统不同的地方是Hadoop更注重容错性和兼容廉价的硬件设备,这样做是为了用很小的预算甚至直接利用现有机器就实现大流量和大数据量的读取。Hadoop使用了POSIX的设计来实现对文件系统文件流的读取。HDFS(Hadoop FileSystem)原来是Apache Nutch搜索引擎(从Lucene发展而来)开发的一个部分,后来独立出来作为一个Apache子项目。Hadoop的假设与目标:硬
  3. 所属分类:其它

    • 发布日期:2013-04-19
    • 文件大小:118784
    • 提供者:kongxinqi
  1. Hadoop下的分布式搜索引擎

  2. Hadoop 系统结构,提出一种改进的 PageRank 算法,使用 Map/Reduce 模式设计系统模块。 实验证明,使用 Hadoop 框架能够设计出具有高性能、高可靠性和易扩展性的分布式搜索引擎
  3. 所属分类:Java

    • 发布日期:2013-04-26
    • 文件大小:1048576
    • 提供者:q1984201234
  1. Hadoop 教程

  2. 教程内容 第一章 Hadoop HadoopHadoopHadoop的起源于体系介绍 的起源于体系介绍 的起源于体系介绍 的起源于体系介绍 的起源于体系介绍 的起源于体系介绍 的起源于体系介绍 Hadoop adoop 学习目标 学习目标 :map/reducemap/reduce map/reducemap/reduce 编程, 编程, pig pig,HbaseHbase Hbase、HiveHiveHiveHive的安装与使用等。 的安装与使用等。 的安装与使用等。 Hadoop ado
  3. 所属分类:其它

    • 发布日期:2013-07-29
    • 文件大小:344064
    • 提供者:liulangchina
  1. 实战Hadoop:开启通向云计算的捷径

  2. 第1章 神奇的大象——Hadoop 1.1 初识神象 1.2 Hadoop初体验 1.2.1 了解Hadoop的构架 1.2.2 查看Hadoop活动 1.3 Hadoop族群 1.4 Hadoop安装 1.4.1 在Linux系统中安装Hadoop 1.4.2 在Windows系统中安装Hadoop 1.4.3 站在象背上说“hello” 1.4.4 Eclipse下的Hadoop应用开发 参考文献 第2章 HDFS——不怕故障的海量存储 2.1 开源的GFS——HDFS 2.1.1 设计前
  3. 所属分类:其它

    • 发布日期:2013-07-31
    • 文件大小:61865984
    • 提供者:jsntghf
  1. Hadoop下的分布式搜索引擎

  2. Hadoop下的分布式搜索引擎,集群化检索
  3. 所属分类:群集服务

    • 发布日期:2015-04-15
    • 文件大小:1048576
    • 提供者:lw163com
  1. 网站架构技术

  2. 大型网站架构演化 大型网站软件系统的特点 大型网站架构演化发展历程 初始阶段 应用服务和数据服务分离 使用缓存改善网站性能 缓存类型 本地缓存 分布式缓存 缓存产品 redis 业界主流 memcached 解决问题 数据库访问 使用应用服务器集群改善网站的并发处理能力 问题: 负载均衡情况下session状态的保持? 解决方案: 基于DNS的负载均衡 反向代理 ngix JK2 数据库的读写分离 问题: 读库与写库的数据同步 解决方案: 不同的数据库都有自己的数据库的主从复制功能 使用反向代
  3. 所属分类:专业指导

    • 发布日期:2016-10-09
    • 文件大小:1048576
    • 提供者:qq_33220449
  1. 大型分布式网站架构与实践

  2. 第1章 面向服务的体系架构(SOA) 1   本章主要介绍和解决以下问题,这些也是全书的基础:   HTTP协议的工作方式与HTTP网络协议栈的结构。   如何实现基于HTTP协议和TCP协议的RPC调用,它们之间有何差别,分别适应何种场景。   如何实现服务的动态注册和路由,以及软负载均衡的实现。   1.1 基于TCP协议的RPC 3   1.1.1 RPC名词解释 3   1.1.2 对象的序列化 4   1.1.3 基于TCP协议实现RPC 6   1.2 基于HTTP协议的RPC 9
  3. 所属分类:Java

    • 发布日期:2018-08-24
    • 文件大小:96468992
    • 提供者:mr_hope
  1. Apache Hadoop---Elasticsearch.docx

  2. Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET(C#)、PHP、Python、Apache Groovy、Ruby和许多其他语言中都是可用的。根据DB-Engines
  3. 所属分类:Hadoop

    • 发布日期:2020-06-11
    • 文件大小:442368
    • 提供者:qq_31641743