期望最大化(EM)算法可以计算混合模型或潜在变量模型(例如潜在Dirichlet分配(LDA))的最大似然(ML)或最大后验(MAP)点估计,这是其中最大的一种过去十年中流行的概率主题建模方法。 但是,批处理EM具有很高的时间和空间复杂性,无法从大数据流中学习大型LDA模型。 在本文中,我们提出了一种快速的在线EM(FOEM)算法,该算法从不断增长的存储需求中不断地推断出以前看不见的文档中的主题分布。 在随机近似框架内,我们表明FOEM可以收敛到LDA似然函数的局部平稳点。 通过动态调度以实现快