传统上,通常假定数据稀疏性是基于用户的协作过滤算法的一个大问题。 然而,分析仅基于数据量而不考虑数据质量,这是数据的重要特征,稀疏的高质量数据可能对算法有利,因此分析是单方面的。 在本文中,首先在真实的数据集上研究了不同稀疏度的训练等级对推荐质量的影响。 初步实验结果表明,数据稀疏性可以对推荐准确性和覆盖率产生积极影响。 接下来,介绍数据噪声的测量。 然后,考虑到数据噪声,重新评估数据稀疏度对算法推荐质量的影响。 实验结果表明,如果稀疏性意味着较高的数据质量(低噪声),则稀疏性对于推荐准确性和覆