内存计算框架的低延迟特性大幅提高了集群的计算效率,但 Shuffle过程的性能瓶颈仍不可规避.宽依赖的同步操作导致大多数工作节点等待慢节点的计算结果,同步过程不仅浪费计算资源,更增加了作业延时,这一 现 象 在 异 构 集 群 环 境 下 尤 为 突 出.针 对 内 存 计 算 框 架 Shuffle操 作 的 同 步 问 题,建立了资源需求模型、执行效率模型和任务分配及调度模型.给 出 了 分 配 效 能 熵(allocationefficiencyentropy,AEE)和节点贡献度(wor