当前,许多云提供商将其大数据处理系统部署为云服务,可帮助用户方便地在云中管理和处理其数据。 在不同的服务提供商的大数据处理服务中,如何评估和比较其可伸缩性是一项有趣且具有挑战性的工作。 大多数传统的基准测试工具都专注于大数据处理系统的性能评估,例如聚合的吞吐量和IOPS,但无法对其扩展性进行定量分析。 本文提出了一种量化大数据处理服务可扩展性的度量方法,可以使云服务具有可扩展性。 我们在AliCloud E-MapReduce和百度MRS上进行了一组比较实验,并在Hadoop和Spark.wor