文件名称:
大数据可视化--联通用户活动规律可视化样本数据csv文件
开发工具:
文件大小: 337kb
下载次数: 0
上传时间: 2020-07-05
详细说明:【知识准备】
探索性数据分析的基本原理和方法;Python语言及相关包的运用;Pandas;Numpy;Matplotlib;Seaborn;Scikit-Leart。
【实训要求】
1、观察样本数据的结构和数据特征;
2、读取样本数据,观察样本数据结构和头尾各10行数据;
3、对样本数据进行分析,找出业务数据中的分布规律;
4、用可视化方法对分析结果进行展示。
5、观察并找出每个特征的样本数据的缺失值和异常值等并提出解决办法;
6、对样本数据进行预处理;
7、采集样本数据存入HBase数据库(选)。
【实训内容】
任务2-1
1、数据源:“sodadata”文件夹下“联通数据_Sample”。
2、项目数据集:
表一结果_Sample_1000条.csv
表二结果_Sample_1000条.csv
3、针对表一样本数据:
(1)分析并展示不同时间段采样的基站服务区内移动用户的活跃度分布;
(2)分析并展示服务区内移动用户工作时间和休息时间的活跃度分布,筛选出当地居民和外来移动用户;
(3)分析用户活动规律,根据其通信特点进行分类。(选做)
4、针对表二样本数据:
(1)分析并展示样本数据中年龄、性别、终端品牌等各类数据的分布规律;
(2)分析缺失和异常数据,提出处理预处理方案;
(3)筛选高价值重点用户(提示:从业务量或消费等方面思考);
(4)如果表一和表二从相同的服务区采集,请思考并提出你的进一步分析方案和商业营销方案。(选做)
5、用Jupyter Notebook根据实训要求编写程序和文档,最终结果打印输出为PDF文档;
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.