Familia开源项目包含文档主题文档,语义匹配计算工具以及基于工业级语料训练的主题模型:Latent Dirichlet Allocation(LDA),SentenceLDA和Topical Word Embedding(TWE)。支持用户以“拿来即用”的方式进行文本分类,文本聚类,个性化推荐等多种场景的研究和应用。考虑到主题模型训练成本以及开源主题模型资源有限的现状,我们会陆续开放基于工业级语料训练的多()一个垂直领域的主题模型,以及这些模型在工业界的典型应用方式,助力主题模型技术的科研和