本文档是Hadoop集群的运维文档,提供了Hadoop集群安装方法和部署,以及对集群的监控。Hadoop是开源的、分布式的数据存储和计算基础框架,其核心包含HDFS和MapReduce等。HBase是基于Hadoop的HDFS之上的分布式列存储数据库,优势在处理大表。HBase对Hadoop进行了无缝的衔接,使得可以在Hadoop的MapReduce框架中直接访问HBase中的数据。Hive是基于Hadoop的数据仓库,它提供类SQL的HQL语句,方便对数据的访问。Hadoop,Apache的开