近年来,尽管视觉跟踪已大大改善,但是由于严重的遮挡,高人群密度和明显的外观变化,人群场景对于人们跟踪仍然特别具有挑战性。 为了解决这些挑战,我们首先设计了一个稀疏核相关滤波器(S-KCF),以抑制由遮挡和照明变化引起的目标响应变化,以及由于类似干扰物体导致的虚假响应。 然后,我们提出一个人员跟踪框架,该框架使用卷积神经网络(CNN)将S-KCF响应图与估计的人群密度图融合在一起,从而生成精炼的响应图。 为了训练融合CNN,我们提出了两阶段策略来逐步优化参数。 第一阶段是在批处理模式下训练初步模型