提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多东西发生了变化,版本也从0.x进化到目前的2.6版本。我把2012年后定义成后Hadoop平台时代,这不是说不用Hadoop,而是像NoSQL(NotOnlySQL)那样,有其他的选型补充。我在知乎上也写过Hadoop的一些入门文章如何学习Hadoop-董飞的回答,为了给大家有个铺垫,简单讲一些相关开源组件。我们的目标是做一个可靠的,支持大规模扩展和容易维护的系统。计算机里面有个locality(局部性定律