简单说明
关于比赛
这是2018年3月到5月,天池大数据比赛的一场关于广告转化率预测的比赛,也是我首次参加的天池大数据比赛,比赛的介绍以及数据下载见:
比赛共有5204支队伍参加,我的排名是复赛第187名,成绩虽然不理想,但从比赛中也学到了过多数据操作上的方法。
关于代码
代码完整的操作步骤是从Step_1到Step_8顺序执行,最后附加的缺失值处理仅作参考,可忽略。
执行完所有步骤估计至少需要32G内存,如果内存占用,可能需要自行加入一些数据分段处理等方法。
数据初步做得少,基本使用源数据