说明: mapreduce复习资料,供学习下载1. 文件处理 1 2. 概要模式 2 2.1 数值概要 2 2.1.1 最大值最小值与计数 2 2.1.2 平均值 6 2.1.3 中位数与标准差 10 2.2 倒排索引概要 14 2.3 计数器计数 17 3. 过滤模式 21 3.1 过滤 21 3.1.1 分布式grep 21 3.1.2 简单随机抽样SRS 22 3.2 布隆过滤 24 3.3 TOP10 28 4. 数据组织模式 32 4.1 分层 32 4.2 分区 37 4.3 分箱 41
<qq_37050329> 在 上传 | 大小:772096