数据集的探索(EDA)主要使用工具:pandas, numpy, matplotlib, seaborn, missingno总体流程第一步:数据的导入第二步:查看数据的基本信息对无关的columns进行处理第三步:对columns进行categories features和numerical features的分类数据特征的相关性分析类别特征的可视化
主要使用工具:pandas, numpy, matplotlib, seaborn, missingno
总体流程
第一步:数据的导入
trai