1、Hadoop 是什么
Hadoop是现阶段数据开发的基础,Hadoop通常是指一个更广泛的概念—-Hadoop生态圈(基于或关于Hadoop的大数据开发的各种软件环境)
是Apache公司使用Java语言编写的开源的,分布式系统的基础架构
分布式就是,当储存数据很多很大时,一台机器储存不了时,需要将数据切成块,使用多台计算机分布式储存这些数据。
由于专业的大数据的服务器比较昂贵,Hadoop解决了,在计算机级别服务器上的,大规模数据的存储和分析计算
Hadoop 官网
2、Hadoop 组成