主要记录推荐系统学习的过程,包含相关的论文和代码。
1.点击率预测
GBDT + LR
论文:
本文发表于2014年,基于传统人工特征工程的思想,此处提出通过GBDT对特征进行组合,生成组合特征喂给LR分类模型,通过机器学习特征,提高模型的准确率。同时,还提出了不同模型不同更新周期的思想。最终,这里还提出了一些工程化的优化方法,某些在线学习方法,使用数据联接器,基于分布式架构将印象记录和单击记录进行联接。对于CTR预测场景正负样本不均衡的问题,使用了降采样的方法,包括uniform subsam