本文来自于infoq.com,介绍生产环境中Hadoop集群现状、Ambari的关键技术,Ambari管理监控线上Hadoop集群的技术方案,线上接管过程中的问题和解决方式。首先介绍我们生产环境中Hadoop集群的现状,Hadoop集群主要承担了数据接入存储、离线计算的职责,同时提供其上数据调度等自研系统的基础服务。生产环境中Hadoop使用的版本是v2.7.3,下面介绍其主要组件。首先HDFS采用了HAwithQJM的高可用架构,即采用StandbyNamenode热备、多节点协同同步Acti