前四节提供了几个小案例
下面详细介绍MapReduce中Map任务Reduce任务以及MapReduce的执行流程。
Map任务:
读取输入文件内容,解析成key,value对。对输入文件的每一行,解析成key,value对。每一个键值对调用一次map函数。
写自己的逻辑,对输入的key,value处理,转换成新的key,value输出。
对输出的key,value进行分区。
对相同分区的数据,按照key进行排序(默认按照字典排序)、分组。相同key的value放在一个集合中。
(可选)分组后对