视频中的人群计数在智能监控领域具有重要价值 . 由于摄像机透视效果、图像背景、人群密度分布不均匀和行人遮挡.等干扰因素的制约 , 基于底层特征的传统计数方法准确率较低 . 本文提出一种基于序的空间金字塔池化 (Rank-based spatial.pyramid pooling, RSPP) 网络的人群计数方法 . 该方法将原图像分成多个具有相同透视范围的子区域并在各个子区域分别取.不同尺度的子图像块 , 采用基于序的空间金字塔池化网络估计子图像块人数 , 然后相加所有子图像块人数得出原图像人数