搜索资源 - Hadoop-MapReduce.docx - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - Hadoop-MapReduce.docx

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

HADOOP监控GANGLIA安装文档.docx
HADOOP监控GANGLIA安装文档，可以生成图表数据，包括cup，io，mapreduce 带宽
所属分类：Java
- 发布日期：2012-03-27
- 文件大小：45056
- 提供者：gairuyi

03-Hadoop-MapReduce.docx
尚硅谷大数据技术之Hadoop-Mapreduce
所属分类：Hadoop
- 发布日期：2019-06-18
- 文件大小：68157440
- 提供者：arne_

Hadoop之高可用集群的安装.docx
1、理解并掌握在完全分布模式的整合平台中Hadoop的高可用完全分布模式的安装与验证 2、完成Hadoop的高可用完全分布模式的安装 3、Hadoop的相关服务进程能够正常启动 4、HDFS能够正常使用 MapReduce示例程序能够正常运行
所属分类：Hadoop
- 发布日期：2020-05-12
- 文件大小：578560
- 提供者：qq_43701418

Hadoop之jdk安装实验报告.docx
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。它可以使用户在不了解分布式底层细节的情况下，开发分布式程序，充分利用集群的威力进行高速运算和存储。hadoop的框架最核心的设计就是HDFS和MapReduce，HDFS为海量的数据提供了存储，MapReduce则为海量的数据提供了计算。本实验报告包含Hodoop之JDK安装过程及实验总结。
所属分类：其它
- 发布日期：2020-05-12
- 文件大小：468992
- 提供者：qq_42407529

大数据技术开发环境搭建.docx
目录软件下载 2 安装虚拟机管理器 2 新建虚拟机，安装Ubuntu 3 锐捷校园认证下虚拟机Ubuntu 的联网设置 11 熟悉Ubuntu系统 13 安装SSH、配置SSH无密码登陆 20 安装Java环境 22 安装Hadoop 24 Hadoop伪分布式配置 25 启动Hadoop 26 运行Hadoop伪分布式实例 30 启动YARN 35 附加教程: 配置PATH环境变量 37 使用Eclipse编译运行MapReduce程序（Hadoop-Eclips
所属分类：Hadoop
- 发布日期：2020-04-15
- 文件大小：17825792
- 提供者：godlovewang

大数据技术之Hadoop（MapReduce）.docx
MapReduce学习，
所属分类：Hadoop
- 发布日期：2020-04-14
- 文件大小：68157440
- 提供者：qq_31821675

Apache Hive 中文手册.docx
hive是基于Hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，能将SQL语句转变成MapReduce任务来执行。
所属分类：Hive
- 发布日期：2020-04-09
- 文件大小：610304
- 提供者：weixin_30777913

Spark入门.docx
Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是——Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
所属分类：spark
- 发布日期：2020-04-02
- 文件大小：271360
- 提供者：qq_32146369

Impala维护操作手册.docx
(一)Impala集群维护简介 PetImpalaabase集群主从节点启动的服务略有不同，其中主节点启动服务主要有：资源管理 Hadoop服务 Hive服务 Impala zookeeper-server hadoop-hdfs-namenode hive-metastore petabase-state-store hadoop-0.20-mapreduce-jobtracker hive-server2 Impala-catalog hadoop-0
所属分类：Hadoop
- 发布日期：2020-03-11
- 文件大小：206848
- 提供者：xsfhchang

实验7-Spark基本操作.docx
Apache Spark是一个开源集群运算框架，最初是由加州大学柏克莱分校AMPLab所开发。相对于Hadoop的MapReduce会在运行完工作后将中介数据存放到磁盘中，Spark使用了存储器内运算技术，能在数据尚未写入硬盘时即在存储器内分析运算。Spark在存储器内运行程序的运算速度能做到比Hadoop MapReduce的运算速度快上100倍，即便是运行程序于硬盘时，Spark也能快上10倍速度。Spark允许用户将数据加载至集群存储器，并多次对其进行查询，非常适合用于机器学习算法。
所属分类：spark
- 发布日期：2019-07-27
- 文件大小：22528
- 提供者：xiaotaocisoc

Apache Hadoop---Sqoop.docx
Sqoop是SQL-to-Hadoop的缩写，是Hadoop的周边工具，它的主要作用是在结构化数据存储与Hadoop之间进行数据交换。Sqoop可以将一个关系型数据库（例如MySQL、Oracle、PostgreSQL等）中的数据导入Hadoop的HDFS、Hive中，也可以将HDFS、Hive中的数据导入关系型数据库中。Sqoop充分利用了Hadoop的优点，整个数据导入导出过程都是用MapReduce实现并行化，同时，该过程中的大部分步骤自动执行，非常方便。
所属分类：Hadoop
- 发布日期：2020-06-12
- 文件大小：1048576
- 提供者：qq_31641743

Apache Hadoop---Spark.docx
Spark是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UCBerkeleyAMPlab(加州大学伯克利分校的AMP实验室)所开源的类HadoopMapReduce的通用并行框架，Spark，拥有HadoopMapReduce所具有的优点；但不同于MapReduce的是——Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。 Spark是一种与Hadoop相似的开源集群计算环境，但是两者之
所属分类：spark
- 发布日期：2020-06-12
- 文件大小：507904
- 提供者：qq_31641743

Apache Hadoop---Pig.docx
Pig运行在Hadoop上，是对大型数据集进行分析和评估的平台。它简化了使用Hadoop进行数据分析的要求，提供了一个高层次的、面向领域的抽象语言：PigLatin。通过PigLatin，数据工程师可以将复杂且相互关联的数据分析任务编码为Pig操作上的数据流脚本，通过将该脚本转换为MapReduce任务链，在Hadoop上执行。和Hive一样，Pig降低了对大型数据集进行分析和评估的门槛。
所属分类：Hadoop
- 发布日期：2020-06-12
- 文件大小：31744
- 提供者：qq_31641743

Apache Hadoop---Hive.docx
Hive是Hadoop中的一个重要子项目，最早由Facebook设计，是建立在Hadoop基础上的数据仓库架构，它为数据仓库的管理提供了许多功能，包括：数据ETL（抽取、转换和加载）工具、数据存储管理和大型数据集的查询和分析能力。Hive提供的是一种结构化数据的机制，定义了类似于传统关系数据库中的类SQL语言：HiveQL，通过该查询语言，数据分析人员可以很方便地运行数据分析业务（将SQL转化为MapReduce任务在Hadoop上执行）。
所属分类：Hive
- 发布日期：2020-06-12
- 文件大小：133120
- 提供者：qq_31641743

Apache Hadoop---HBase.docx
HBase是一个针对结构化数据的可伸缩、高可靠、高性能、分布式和面向列的动态模式数据库。和传统关系数据库不同，HBase采用了BigTable的数据模型：增强的稀疏排序映射表（Key/Value），其中，键由行关键字、列关键字和时间戳构成。HBase提供了对大规模数据的随机、实时读写访问，同时，HBase中保存的数据可以使用MapReduce来处理，它将数据存储和并行计算完美地结合在一起。
所属分类：Hbase
- 发布日期：2020-06-11
- 文件大小：531456
- 提供者：qq_31641743

Apache Hadoop---Crunch.docx
Apache Crunch 是基于 FlumeJava 实现的，它是一个基于 MapReduce 的数据管道库。Apache Crunch是一个 Java 类库，它用于简化 MapReduce 作业的编写和执行，并且可以用于简化连接和数据聚合任务API的Java类库。与 Pig 和 Hive 一样，Crunch 是为了降低 MapReduce 的入门成本。它们的区别是：Pig 是一个基于管道的框架，而 Crunch 则是一个 Java 库，它提供比 Pig 更高级别的灵活性。
所属分类：Hadoop
- 发布日期：2020-06-11
- 文件大小：19456
- 提供者：qq_31641743

Apache Hadoop---Ambari.docx
Apache Ambari是一种基于Web的工具，支持Apache Hadoop集群的供应、管理和监控。Ambari已支持大多数Hadoop组件，包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Hcatalog等。但是这里的 Hadoop 是广义，指的是 Hadoop 整个生态圈（例如 Hive，Hbase，Sqoop，Zookeeper 等），而并不仅是特指 Hadoop。
所属分类：Hadoop
- 发布日期：2020-06-11
- 文件大小：368640
- 提供者：qq_31641743

Apache Hadoop---Alluxio.docx
Tachyon（/'tæki:ˌɒn/ 意为超光速粒子）是以内存为中心的分布式文件系统，拥有高性能和容错能力，能够为集群框架（如Spark、MapReduce）提供可靠的内存级速度的文件共享服务。从软件栈的层次来看，Tachyon是位于现有大数据计算框架和大数据存储系统之间的独立的一层。它利用底层文件系统作为备份，对于上层应用来说，Tachyon就是一个分布式文件系统。
所属分类：Hadoop
- 发布日期：2020-06-11
- 文件大小：406528
- 提供者：qq_31641743

Hadoop-MapReduce.docx
Hadoop-MapReduce.docxHadoop-MapReduce.docxHadoop-MapReduce.docx
所属分类：Hadoop
- 发布日期：2020-10-10
- 文件大小：7340032
- 提供者：Yubingx

大数据技术之Hadoop(MapReduce&Yarn).docx
大数据技术之Hadoop(MapReduce&Yarn).docx详细文档
所属分类：Hadoop
- 发布日期：2021-03-03
- 文件大小：4194304
- 提供者：qq_32727095

« 12 »