传统的监督分类器仅将标记的数据(特征/标记对)用作训练集,而未标记的数据用作测试集。 在实践中,通常情况是很难获得标记的数据,而未标记的数据包含属于预定义类的实例,而不是属于标记的数据类别的实例。 近年来,已经对该问题进行了广泛研究,半监督PU学习是从正面和未标记示例中学习的有效解决方案。 在所有半监督的PU学习方法中,很难仅选择一种方法来适合所有未标记的数据分布。 为了利用现有方法,本文设计了一个新的框架来集成不同的半监督PU学习算法。 本质上,我们利用未标记数据分布的知识提出了一种自动KL散