自然语言处理(NLP)的最新进展表明,分布式模型可以有效地获取单词的语义上有意义的表示。 在这种情况下,文本文档可以看作是词袋嵌入(BoWE),剩下的问题是如何获取文档的固定长度矢量表示以进行有效的文档处理。 除了这些启发式聚合方法之外,最近的工作表明,人们可以利用Fisher Fisher(FK)框架以有原则的方式基于BoWE生成文档表示。 在这项工作中,单词是通过潜在语义索引(LSI)嵌入到欧氏空间中的,而高斯混合模型(GMM)被用作基于FK的非线性聚合的生成模型。 在这项工作中,我们提出了