lgb
代码入口:sh base_run.sh。
写了很多冗余特征,跑起来非常慢,需要做一下特征选择。
线上提交后0.7154。
代码中用到了分词和词向量,需要将切词的代码换成自己的切词代码,需要自己提供词向量。
我的预训练向量是之前使用百科文本作为预料利用FastText训练出来的。
恩
数据准备:python3 data / data_preprocess.py。
代码入口:python3 src / run_model.py train / pred。
写了两个网络cnn_network_