图像标记是图像处理中众所周知的挑战。 通常通过多实例多标签(MIML)分类方法解决该问题。 卷积神经网络(CNN)具有出色的潜力,可以很好地执行MIML任务,因为多级卷积和最大池与多实例设置一致,并且隐藏表示的共享可能有利于多标签建模。 但是,CNN通常需要大量经过仔细标记的数据来进行训练,这在许多实际应用中很难获得。 在本文中,我们提出了一种将预训练的深度网络(如Imagenet上的VGG16)传输到小型MIML任务的新方法。 我们从网络层的每个组中提取特征,并将多个二进制分类器应用于它们以进