在Internet上创建和分发的纯文本文档正以各种形式发生变化。这些文档的挖掘主题在许多领域都有重要的应用。大多数文献致力于主题建模,而文档流中主题的顺序模式则被忽略。此外,传统的顺序模式挖掘算法主要关注确定性数据集的频繁模式,因此不适合主题不确定和稀有模式的文档流。在本文中,我们制定并处理了针对Internet文档流的稀有顺序主题模式(STP)的挖掘问题,该问题总体上很少见,但对于特定用户而言则相对较少,因此也很有趣。由于这种类型的稀有STP反映了用户的特定行为,因此我们的工作可以应用于许多领