潜在主题模型(例如潜在Dirichlet分配(LDA))已设计用于文本处理,并且在音频相关处理的任务中也得到了证明。 LDA背后的主要思想是假设每个文档的单词都来自主题的混合体,每个主题都是词汇表上的多项式分布。 将原始LDA应用于连续数据处理时,首先需要通过矢量量化(VQ)生成字样单元。 这种数据离散化通常会导致信息丢失。 为了克服这种不足,本文介绍了一种新的主题模型,即高斯-LDA,用于音频检索。 在提出的模型中,我们考虑了连续发射概率,即高斯分布而不是多项式分布。 这个新的主题模型跳过