您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. HADOOP监控GANGLIA安装文档.docx

  2. HADOOP监控GANGLIA安装文档,可以生成图表数据,包括cup,io,mapreduce 带宽
  3. 所属分类:Java

    • 发布日期:2012-03-27
    • 文件大小:45056
    • 提供者:gairuyi
  1. 03-Hadoop-MapReduce.docx

  2. 尚硅谷大数据技术之Hadoop-Mapreduce
  3. 所属分类:Hadoop

    • 发布日期:2019-06-18
    • 文件大小:68157440
    • 提供者:arne_
  1. Hadoop之高可用集群的安装.docx

  2. 1、理解并掌握在完全分布模式的整合平台中Hadoop的高可用完全分布模式的安装与验证 2、完成Hadoop的高可用完全分布模式的安装 3、Hadoop的相关服务进程能够正常启动 4、HDFS能够正常使用 MapReduce示例程序能够正常运行
  3. 所属分类:Hadoop

    • 发布日期:2020-05-12
    • 文件大小:578560
    • 提供者:qq_43701418
  1. Hadoop之jdk安装实验报告.docx

  2. Hadoop是一个由Apache基金会所开发的分布式系统基础架构。它可以使用户在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储。hadoop的框架最核心的设计就是HDFS和MapReduce,HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算。 本实验报告包含Hodoop之JDK安装过程及实验总结。
  3. 所属分类:其它

    • 发布日期:2020-05-12
    • 文件大小:468992
    • 提供者:qq_42407529
  1. 大数据技术开发环境搭建.docx

  2. 目录 软件下载 2 安装虚拟机管理器 2 新建虚拟机,安装Ubuntu 3 锐捷校园认证下虚拟机Ubuntu 的联网设置 11 熟悉Ubuntu系统 13 安装SSH、配置SSH无密码登陆 20 安装Java环境 22 安装Hadoop 24 Hadoop伪分布式配置 25 启动Hadoop 26 运行Hadoop伪分布式实例 30 启动YARN 35 附加教程: 配置PATH环境变量 37 使用Eclipse编译运行MapReduce程序(Hadoop-Eclips
  3. 所属分类:Hadoop

    • 发布日期:2020-04-15
    • 文件大小:17825792
    • 提供者:godlovewang
  1. 大数据技术之Hadoop(MapReduce).docx

  2. MapReduce学习,
  3. 所属分类:Hadoop

    • 发布日期:2020-04-14
    • 文件大小:68157440
    • 提供者:qq_31821675
  1. Apache Hive 中文手册.docx

  2. hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。
  3. 所属分类:Hive

    • 发布日期:2020-04-09
    • 文件大小:610304
    • 提供者:weixin_30777913
  1. Spark入门.docx

  2. Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
  3. 所属分类:spark

    • 发布日期:2020-04-02
    • 文件大小:271360
    • 提供者:qq_32146369
  1. Impala维护操作手册.docx

  2. (一)Impala集群维护简介 PetImpalaabase集群主从节点启动的服务略有不同,其中主节点启动服务主要有: 资源管理 Hadoop服务 Hive服务 Impala zookeeper-server hadoop-hdfs-namenode hive-metastore petabase-state-store hadoop-0.20-mapreduce-jobtracker hive-server2 Impala-catalog hadoop-0
  3. 所属分类:Hadoop

    • 发布日期:2020-03-11
    • 文件大小:206848
    • 提供者:xsfhchang
  1. 实验7-Spark基本操作.docx

  2. Apache Spark是一个开源集群运算框架,最初是由加州大学柏克莱分校AMPLab所开发。相对于Hadoop的MapReduce会在运行完工作后将中介数据存放到磁盘中,Spark使用了存储器内运算技术,能在数据尚未写入硬盘时即在存储器内分析运算。Spark在存储器内运行程序的运算速度能做到比Hadoop MapReduce的运算速度快上100倍,即便是运行程序于硬盘时,Spark也能快上10倍速度。Spark允许用户将数据加载至集群存储器,并多次对其进行查询,非常适合用于机器学习算法。
  3. 所属分类:spark

    • 发布日期:2019-07-27
    • 文件大小:22528
    • 提供者:xiaotaocisoc
  1. Apache Hadoop---Sqoop.docx

  2. Sqoop是SQL-to-Hadoop的缩写,是Hadoop的周边工具,它的主要作用是在结构化数据存储与Hadoop之间进行数据交换。Sqoop可以将一个关系型数据库(例如MySQL、Oracle、PostgreSQL等)中的数据导入Hadoop的HDFS、Hive中,也可以将HDFS、Hive中的数据导入关系型数据库中。Sqoop充分利用了Hadoop的优点,整个数据导入导出过程都是用MapReduce实现并行化,同时,该过程中的大部分步骤自动执行,非常方便。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-12
    • 文件大小:1048576
    • 提供者:qq_31641743
  1. Apache Hadoop---Spark.docx

  2. Spark是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UCBerkeleyAMPlab(加州大学伯克利分校的AMP实验室)所开源的类HadoopMapReduce的通用并行框架,Spark,拥有HadoopMapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。 Spark是一种与Hadoop相似的开源集群计算环境,但是两者之
  3. 所属分类:spark

    • 发布日期:2020-06-12
    • 文件大小:507904
    • 提供者:qq_31641743
  1. Apache Hadoop---Pig.docx

  2. Pig运行在Hadoop上,是对大型数据集进行分析和评估的平台。它简化了使用Hadoop进行数据分析的要求,提供了一个高层次的、面向领域的抽象语言:PigLatin。通过PigLatin,数据工程师可以将复杂且相互关联的数据分析任务编码为Pig操作上的数据流脚本,通过将该脚本转换为MapReduce任务链,在Hadoop上执行。和Hive一样,Pig降低了对大型数据集进行分析和评估的门槛。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-12
    • 文件大小:31744
    • 提供者:qq_31641743
  1. Apache Hadoop---Hive.docx

  2. Hive是Hadoop中的一个重要子项目,最早由Facebook设计,是建立在Hadoop基础上的数据仓库架构,它为数据仓库的管理提供了许多功能,包括:数据ETL(抽取、转换和加载)工具、数据存储管理和大型数据集的查询和分析能力。Hive提供的是一种结构化数据的机制,定义了类似于传统关系数据库中的类SQL语言:HiveQL,通过该查询语言,数据分析人员可以很方便地运行数据分析业务(将SQL转化为MapReduce任务在Hadoop上执行)。
  3. 所属分类:Hive

    • 发布日期:2020-06-12
    • 文件大小:133120
    • 提供者:qq_31641743
  1. Apache Hadoop---HBase.docx

  2. HBase是一个针对结构化数据的可伸缩、高可靠、高性能、分布式和面向列的动态模式数据库。和传统关系数据库不同,HBase采用了BigTable的数据模型:增强的稀疏排序映射表(Key/Value),其中,键由行关键字、列关键字和时间戳构成。HBase提供了对大规模数据的随机、实时读写访问,同时,HBase中保存的数据可以使用MapReduce来处理,它将数据存储和并行计算完美地结合在一起。
  3. 所属分类:Hbase

    • 发布日期:2020-06-11
    • 文件大小:531456
    • 提供者:qq_31641743
  1. Apache Hadoop---Crunch.docx

  2. Apache Crunch 是基于 FlumeJava 实现的,它是一个基于 MapReduce 的数据管道库。Apache Crunch是一个 Java 类库,它用于简化 MapReduce 作业的编写和执行,并且可以用于简化连接和数据聚合任务API的Java类库。与 Pig 和 Hive 一样,Crunch 是为了降低 MapReduce 的入门成本。它们的区别是:Pig 是一个基于管道的框架,而 Crunch 则是一个 Java 库,它提供比 Pig 更高级别的灵活性。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-11
    • 文件大小:19456
    • 提供者:qq_31641743
  1. Apache Hadoop---Ambari.docx

  2. Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Hcatalog等。但是这里的 Hadoop 是广义,指的是 Hadoop 整个生态圈(例如 Hive,Hbase,Sqoop,Zookeeper 等),而并不仅是特指 Hadoop。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-11
    • 文件大小:368640
    • 提供者:qq_31641743
  1. Apache Hadoop---Alluxio.docx

  2. Tachyon(/'tæki:ˌɒn/ 意为超光速粒子)是以内存为中心的分布式文件系统,拥有高性能和容错能力,能够为集群框架(如Spark、MapReduce)提供可靠的内存级速度的文件共享服务。 从软件栈的层次来看,Tachyon是位于现有大数据计算框架和大数据存储系统之间的独立的一层。它利用底层文件系统作为备份,对于上层应用来说,Tachyon就是一个分布式文件系统。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-11
    • 文件大小:406528
    • 提供者:qq_31641743
  1. Hadoop-MapReduce.docx

  2. Hadoop-MapReduce.docxHadoop-MapReduce.docxHadoop-MapReduce.docx
  3. 所属分类:Hadoop

    • 发布日期:2020-10-10
    • 文件大小:7340032
    • 提供者:Yubingx
  1. 大数据技术之Hadoop(MapReduce&Yarn).docx

  2. 大数据技术之Hadoop(MapReduce&Yarn).docx详细文档
  3. 所属分类:Hadoop

    • 发布日期:2021-03-03
    • 文件大小:4194304
    • 提供者:qq_32727095
« 12 »