文件名称:
pandasTrain.html python-pandas的一些小练习——东北大学大数据班数据挖掘实训Python基础二(2)
开发工具:
文件大小: 329kb
下载次数: 0
上传时间: 2020-03-29
详细说明:python-pandas的一些小练习——东北大学大数据班数据挖掘实训Python基础二(2)
实训练习:练习使用pandas 包中的dataframe和方法。
1将数据读取为dataframe类型,命名为df
2查看数据的形状[了解数据有多少行、多少列]
3查看数据的最开始的7条数据和尾部的3条数据
4查看数据的各字段的类型
5查看数据是否有缺失值
6如果有缺失值,进行补0操作
7从df中按字段取出‘ date’’dist’和‘ flight’形成新的df1
8从df中按位置选取行为3和4,列为0,1的数据形成新的df2
9在df中添加一列‘ low_dest’,内容是‘ dest’这列的字符串的小写形式
10从df中选取‘ dist’大于1000并且小于1200的数据作为一个新的df3
11从df中选取‘ time’大于100的数据做为新的df4
12将df3和df4合并为一个dataframe,命名为df5
13取出df3中的‘ time’,‘dist’ 这两列做为df6, 求出df6中每列中最大值与最小值的差值(运用lambda函数的方式进行求解 )
14将df根据“ dest”分组,统计各目的地,都有多少条数据,命名为“ dest_count”,然后将“ dest”和“ dest_count”组成新的dataframe命名为df7
15根据dep_delay不为0,统计df中有多少次航班起飞延误
16利用plane字段,统计df中不同航班的飞行次数,以plane和plane_cout格式保存为df8
17利用carrier字段,计算df中carrier字段不同属性数据的数据量的比值(如:XE的数据量与MQ的数据量的比值)
18分别将df7和 df8保存到本地文件,文件名分别为df7.csv和df8.csv
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.