【知识准备】
探索性数据分析的基本原理和方法;Python语言及相关包的运用;Pandas;Numpy;Matplotlib;Seaborn;Scikit-Leart。
【实训要求】
1、观察样本数据的结构和数据特征;
2、读取样本数据,观察样本数据结构和头尾各10行数据;
3、对样本数据进行分析,找出业务数据中的分布规律;
4、用可视化方法对分析结果进行展示。
5、观察并找出每个特征的样本数据的缺失值和异常值等并提出解决办法;
6、对样本数据进行预处理;
7、采集样本数据存入HBase数据库(