薪资预测
预测员工的薪水是否超过5万或将低于5万。
介绍
根据所考虑的数据集,我们需要预测归类为“工资”的分类特征“薪水”,工资 50k分为两类。 数据集是分类特征和连续特征的混合,其中其他分类特征包括“工作类别”,“教育”,“婚姻状况”,“职业”,“关系”,“种族”,“性别”,“本国” '。 同样,此数据集包含缺失值以及离群值,然后将其剔除。 分类特征经过标签编码和分析。 在数据集上进行了各种探索性数据分析技术和可视化。
数据集
这里使用的数据集是“成人收入”数据集,由32561个观察值和14