简单垃圾邮件分类器
这是一个使用python的简单垃圾邮件分类器的系统(理论上可以用于任何二进制分类器,但只会返回SPAM / HAM标签)。 当前,此系统将SPAM定义为0,将HAM定义为1。分类器使用scikit-learn包。分类器使用scikit-learn包。 它有5个可用的分类器,每次对其进行训练时,它将搜索模型的最佳参数。 对于NGram,它同时使用unigram和bigram。 如有必要,您可以更改搜索参数。 具有〜10000个训练数据和测试数据的单个MultinomialNB分