您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于Hadoop的分布式搜索引擎研究与实现

  2. 分布式搜索引擎是一种结合了分布式计算技术和全文检索技术的新型信息检索系统。它改变了人们获取信息的途径,让人们更有效地获取信息,现在它已经深入到网络生活的每一方面,被誉为上网第一站。
  3. 所属分类:Java

    • 发布日期:2011-06-03
    • 文件大小:2097152
    • 提供者:cool_time
  1. Gluster_Hadoop_Compatible_Storage.pdf

  2. Glusterfs(分布式文件系统) Hadoop到结合
  3. 所属分类:群集服务

    • 发布日期:2012-08-14
    • 文件大小:364544
    • 提供者:hj19870806
  1. HdfsWeb.rar

  2. 这个小的例子是本人直接结合hadoop集群和web一起开发的上传和下载功能,把本地文件上传到云端和从云端下载到本地。
  3. 所属分类:Java

    • 发布日期:2013-06-08
    • 文件大小:921600
    • 提供者:guofeng2010
  1. Hive和Hase配置

  2. 配置hive-0.9.0和hbase-0.94.1结合使用,部分内容如下: 1.拷贝hbase-0.94.1.jar和zookeeper-3.4.3.jar到hive/lib下。 注意:如hive/lib下已经存在这两个文件的其他版本,建议删除后使用hbase下的相关版本。 //在/home/hadoop/hive-0.9.0/lib 下,备份两个jar包 mv hbase-0.92.0.jar hbase-0.92.0.jar.bak mv zookeeper-3.4.3.jar zooke
  3. 所属分类:其它

    • 发布日期:2013-07-01
    • 文件大小:3072
    • 提供者:xin_jmail
  1. Hadoop 入门pdf文档

  2. Hadoop 入门文档 Hadoop 的系统中,会有一台Master,主要负责NameNode 的工作以及JobTracker 的工 作。JobTracker 的主要职责 就是启动、跟踪和调度各个Slave 的任务执行。还会有多台Sl ave,每一台Slave 通常具有DataNode 的功能并负责TaskTracker 的 工作。TaskTracker 根据应用要求来结合本地数据执行Map 任务以及Reduce 任务。 说到这里,就要提到分布式计算最重要的一个设计点:Moving Compu
  3. 所属分类:其它

    • 发布日期:2013-12-04
    • 文件大小:301056
    • 提供者:kingjin55
  1. Storm入门教程 之Storm原理和概念详解

  2. Storm流计算从入门到精通之技术篇(高并发策略、批处理事务、Trident精解、运维监控、企业场景) Storm入门教程 之Storm原理和概念详解,出自Storm流计算从入门到精通之技术篇,Storm入门视频教程用到技术:Storm集群、Zookeeper集群等,涉及项目:网站PV、UV案例实战、其他案例; Storm视频教程亮点: 1、Storm全面、系统、深入讲解,采用最新的稳定版本Storm 0.9.0.1 ; 2、注重实践,对较抽象难懂的技术点如Grouping策略、并发度及线程安
  3. 所属分类:数据库

    • 发布日期:2014-07-18
    • 文件大小:33554432
    • 提供者:u013802231
  1. 开源力量——数据挖掘原理与实战

  2. 整套大数据课程从hadoop入门开始,由浅入深,内置“hadoop源码解析与企业应用开发实战”,“Hive开发实战”,“Hbase开发实战”,“Spark,mahout,sqoop,storm诸模块开发实战”,“数据挖掘基础。这个系列课程有几个板块组成,所以学员可以按照自己的实际情况选择学习。例如,对于只需要了解hadoop基本编程的人,只需要选择“hadoop源码解析与企业应用开发实战”模块就可以了;对于立志于从事大数据领域的零起点人员,可以选择四个板块依次学习;对于已经有一定基础的hado
  3. 所属分类:Java

  1. Hadoop技术内幕 深入理解MapReduce架构设计与实现原理.pdf

  2. Hadoop技术内幕:深入解析MapReduce架构设计与实现原理 目录 前言 第一部分 基础篇 第1章 阅读源代码前的准备 1.1 准备源代码学习环境 1.1.1 基础软件下载 1.1.2 如何准备Windows环境 1.1.3 如何准备Linux环境 1.2 获取Hadoop源代码 1.3 搭建Hadoop源代码阅读环境 1.3.1 创建Hadoop工程 1.3.2 Hadoop源代码阅读技巧 1.4 Hadoop源代码组织结构 1.5 Hadoop初体验 1.5.1 启动Hadoop 1
  3. 所属分类:Java

    • 发布日期:2015-11-24
    • 文件大小:48234496
    • 提供者:yuan_xw
  1. Python示例-从基础到高手PDF

  2. 目录 第1章 Python 处理 cassandra 升级后的回滚脚本 第 2 章 多套方案来提高 python web 框架的并发处理能力 第 3 章 python 写报警程序中的声音实现 winsound 第 4 章 一个脚本讲述 python 语言的基础规范,适合初学者 第 5 章 python 计算文件的行数和读取某一行内容的实现方法 第 6 章 python 中用 string.maketrans 和 translate 巧妙替换字符串 第 7 章 python linecache
  3. 所属分类:Python

    • 发布日期:2017-10-25
    • 文件大小:10485760
    • 提供者:netghost1919
  1. 基于Hadoop的并行共享决策树挖掘算法研究

  2. 共享知识挖掘是指通过学习不同事物之间的共享知识,将学习到的知识应用到未知事物来加快认知未知事物。针对大数据集中串行共享知识挖掘算法效率低下的问题,结合云计算技术,提出了一种基于Hadoop的并行共享决策树挖掘算法(PSDT)。该算法采用传统的属性表结构实现并行挖掘,但其I/O操作过多,影响算法性能,为此,进一步提出了一种混合并行共享决策树挖掘算法(HPSDT)。该算法采用混合数据结构,在计算分裂指标阶段使用属性表结构,在分裂阶段采用数据记录结构。数据分析表明,HPSDT算法简化了分裂过程,其I
  3. 所属分类:Hadoop

    • 发布日期:2018-07-03
    • 文件大小:614400
    • 提供者:qq_28339273
  1. IT十八掌徐培成大数据培训资料

  2. 精心规划,课程涵盖Hadoop大数据生态圈全方位剖析,做到知识无死角,挑战高薪大数据职位; 循序渐进,由浅入深学习大数据技能,大数据处理技术方方面面一览无余,积跬步以至千里。 企业案例,理论与实际相结合,技术与操作同进行,学以致用,止于至善。 从内到外理解大数据各种技术,HBase,Hive,Pig,Zookeeper等等技术源码级传授,从无到有掌握Hadoop技术。
  3. 所属分类:Java

    • 发布日期:2018-08-24
    • 文件大小:238
    • 提供者:michaelgao123
  1. Hadoop集群部署实例

  2. 由于工作需要,最近一段时间开始接触学习 Hadoop 相关的东西,目前公司的实时任务和离线任务都跑在一个 Hadoop 集群,离线 任务的特点就是每天定时跑,任务跑完了资源就空闲了,为了合理的利用资源,我们打算在搭一个集群用于跑离线任务,计算节点和 储存节点分离,计算节点结合 aws 的 Auto Scaling(自动扩容、缩容服务)以及竞价实例,动态调整,在跑任务的时候拉起一批实 例,任务跑完就自动释放掉服务器,本文记录下 Hadoop 集群的搭建过程,方便自己日后查看,也希望能帮到初学者,
  3. 所属分类:Hadoop

    • 发布日期:2018-02-06
    • 文件大小:1048576
    • 提供者:tornadom
  1. 2017最新大数据架构师精英课程

  2. 本资源为大数据基础到中高级教学资源,适合稍微有点大数据或者java基础的人群学习,资源过大,上传乃是下载链接,不多说,上目录: 1_java基础2 l3 a2 a$ t7 J2 b+ `- p 2_java引入ide-eclipse 3_java基础知识-循环-类型转换 4_循环-函数-数组-重载 5_多为数组-冒泡-折半-选择排序 6_oop-封装-继承-static-final-private 7_多态-接口-异常体系 8_适配器/ k% N! Y7 j/ |- c) O5 M' V6 S
  3. 所属分类:Java

  1. 基于Hadoop的煤炭企业数据共享系统设计

  2. 针对煤炭企业数据处理能力的不足,将云计算技术应用到煤炭企业数据共享体系中,提出了一个利用Hadoop平台对煤炭企业数据进行高效共享的系统。首先,介绍了Hadoop平台及其关键技术;而后建立了应用于煤炭企业的数据共享模型,该模型抽取源数据并通过数据集成存储于数据仓库;最后结合煤炭企业实际需求,设计了数据管理平台,完成了数据集成、模型和并行关联算法的设计。
  3. 所属分类:其它

    • 发布日期:2020-07-08
    • 文件大小:283648
    • 提供者:weixin_38654944
  1. bi_development_source_code:传统大数据分析工具以Hadoop,Spark为代表,集成集成的技术框架,对用户来说又重又笨又不灵活,难以维护和驾驭,国际和国内的敏捷型BI工具在对接时又面临性能本项目独辟蹊径,以阿里开源

  2. 数据挖掘 传统大数据分析工具以Hadoop,Spark为代表,集成集成的技术框架,对用户来说又重又笨又不灵活,难以维护和驾驭,国际和国内的敏捷型BI工具在对接时又面临性能本项目独辟蹊径,以阿里开源的DataX为ETL工具,以列式数据库ClickHouse做为中间数据存储源,通过视图关联构建大数据集,解决亿万级数据的即时分析性能,再辅以强大的数据可视化设计前端,通过用户自定义菜单和模板进行呈现,实现用户的自助式分析和探索。 通过灵活的预警功能,设置一些自定义的监控指标,当监控指标超过异常值时,系统
  3. 所属分类:其它

    • 发布日期:2021-03-24
    • 文件大小:80740352
    • 提供者:weixin_42173218
  1. 四种方案:将OpenStack私有云部署到HadoopMapReduce环境中

  2. OpenStack与Hadoop被誉为继Linux之后最有可能获得巨大成功的开源项目。这二者如何结合成为更猛的新方案?业内给出两种答案:Hadoop跑在OpenStack上或OpenStack部署到Hadoop上。SteveMarkey教授重点介绍了后者。这两种答案都有企业在实践。“Hadoop跑在OpenStack上”可以参考《ProjectSavanna:让Hadoop运行在OpenStack之上》,“OpenStack部署到Hadoop上”则重点可查阅本文。随着企业开始同时利用云计算和大数
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:223232
    • 提供者:weixin_38731385
  1. Spark与Hadoop的结合

  2. 本文来自于csdn,本文介绍了Spark是基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合。Spark可以直接对HDFS进行数据的读写,同样支持SparkonYARN。Spark可以与MapReduce运行于同集群中,共享存储资源与计算,数据仓库Shark实现上借用Hive,几乎与Hive完全兼容。RDD是Spark的最基本抽象,是对分布式内存的抽象使用,实现了以操作本地集合的方式来操作分布式数据集的抽象实现。RDD是Spark最核心的东西,它表示已被分区,不可变的并能够被并行操作
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:276480
    • 提供者:weixin_38502814
  1. Enrich-data-using-HDFS:该项目结合了加拿大加拿大大都会蒙特利尔的STM_GTFS的实时数据。这些文件存储在Hadoop文件系统(HDFS)中,该项目从HDFS中提取输入文件并丰富他们一起成为一个文件,并将写回到HDFS

  2. #Enrich-data-using-HDFS该项目组合了加拿大国家/地区的大都会蒙特利尔STM_GTFS的实时数据。文件存储在Hadoop文件系统(HDFS)中,该项目从HDFS中提取输入文件并进行充实将它们一起存储到一个文件中,并将其写回到HDFS中。 在ETL管道泛化的这个项目中,|配置Hadoop API |与Hadoop HDFS API一起使用|了解如何更改管道以与多个数据源一起使用 将输入文件(行程,路线,日历)从STM-GTFS存储库下载到Hadoop文件系统(HDFS),并相
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:7168
    • 提供者:weixin_42104778
  1. 结合使用Hadoop和Couchbase

  2. 简介:Hadoop非常适合处理大量数据并将该信息解析为您可查询的较小的信息集。但是,通过与CouchbaseServer集成,您可以对信息执行实时查询和报告,同时继续使用Hadoop处理大型数据集和数据集的繁重处理工作。CouchbaseServer还使用了一个MapReduce查询系统,这使您能够轻松地迁移和集成索引和查询系统,从而有效地提取和操作信息。Hadoop将许多重要特性结合在一起,这使Hadoop对于将大量数据分解为更小、实用的数据块非常有用。Hadoop的主要组件是HDFS文件系统
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:144384
    • 提供者:weixin_38630091
  1. 四种方案:将OpenStack私有云部署到HadoopMapReduce环境中

  2. OpenStack与Hadoop被誉为继Linux之后最有可能获得巨大成功的开源项目。这二者如何结合成为更猛的新方案?业内给出两种答案:Hadoop跑在OpenStack上或OpenStack部署到Hadoop上。SteveMarkey教授重点介绍了后者。这两种答案都有企业在实践。“Hadoop跑在OpenStack上”可以参考《ProjectSavanna:让Hadoop运行在OpenStack之上》,“OpenStack部署到Hadoop上”则重点可查阅本文。随着企业开始同时利用云计算和大数
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:223232
    • 提供者:weixin_38720050
« 12 »