词嵌入和递归神经网络用于灾害鸣叫分类
魏伯阳邱乐川
客观的
该项目致力于使用不同的词嵌入和递归神经网络对进行分类。 我们正在探索TF-IDF,Word2Vec,LSTM和BERT如何执行二进制分类任务,特别是针对此样本数据集。
数据
来自Kaggle Competition的推文灾难数据用于从数据清理,建模到评估的整个流程。 数据由通用分隔值形式的培训和测试文件组成。 培训和测试文件包含3243和7503唯一行和4个功能。 可以在数据目录中以cleaned.csv找到已清理的数据。
背景
用