文本和多媒体挖掘项目“ ASD相关文章的动态主题建模”中使用的代码
与自闭症谱系障碍(ASD)相关的文章的主要数据集以及评论文章的验证数据集可通过笔记本DataRetrieval.ipynb (在Google Colab中运行)进行检索
使用DataPreProcessing.py对主数据集执行预处理
使用TrainDTM.py训练具有不同主题数量的主题模型
结果模型及其内部结构通过Results.py研究和可视化
最后,对验证数据集进行预处理,并使用Validation.py进行分析
所有文件