基于外观的视觉袋词(BoVW)模型用于表示图像中局部特征的词汇频率。 由于它们的多功能性,尽管它们忽略了潜在的空间背景和要素之间的关系,但它们却广受欢迎。 在这里,我们提出了一个统一的表示形式,通过显式的局部和全局结构模型来增强BoVW。 与以前的方法相比,应注意我们方法的三个方面。 首先,我们使用局部结构特征,使用类标签信息以区分方式对一对点之间的空间属性进行编码。 我们针对给定的图像集引入了结构袋词(BoSW)模型,并使用该模型在其粗糙采样的相关关键点上描述了每个图像。 然后,我们结合BoV