MR
1.MapTask调用Inputformat方法创建一个RecordReader
RecordReader以此调用nextkeyvalue getcurrentkey getcurrentvalue方法
获取传递给Mapper类,每读取一行数据就会调用一次map方法,然后将
通过逻辑处理后的输出到OutputCollector
2.Collector将数据缓存到环形缓冲区中,存满80%的数据后会溢出到溢出器
spiller中,然后再溢出器中进行分区和快速排序,将分区后的数据生成
几个文件(