您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. python数据清洗Pandas指导手册

  2. python数据清洗Pandas指导手册,有详细的方法使用事例,可以通过IPython Notebook打开
  3. 所属分类:Python

    • 发布日期:2018-01-28
    • 文件大小:935936
    • 提供者:ml_1019
  1. Python实现网络爬虫&数据清洗.zip

  2. 通过10个文件从小功能一步步更新到网络爬虫、数据清洗 1.AQI计算 2.读取已经获取的JSON数据文件,并将AQI前5的数据输出到文件 3.CSV 4.根据输入文件判断是CSV还是JSON格式,并进行相应操作(with语句 os模块) 5、6、7、8.网络爬虫 requests模块 9.Pandas数据处理 数据分析 10.Pandas数据清洗 数据过滤
  3. 所属分类:讲义

    • 发布日期:2019-09-13
    • 文件大小:7168
    • 提供者:openscenegraph
  1. pandas数据清洗,排序,索引设置,数据选取方法

  2. 下面小编就为大家分享一篇pandas数据清洗,排序,索引设置,数据选取方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  3. 所属分类:其它

    • 发布日期:2020-09-20
    • 文件大小:73728
    • 提供者:weixin_38606466
  1. Pandas 数据处理,数据清洗详解

  2. 今天小编就为大家分享一篇Pandas 数据处理,数据清洗详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  3. 所属分类:其它

    • 发布日期:2020-09-20
    • 文件大小:57344
    • 提供者:weixin_38622827
  1. python数据清洗学习记录–文件读写

  2. python数据清洗学习记录–文件读写 目录python数据清洗学习记录–文件读写csv文件读写excel文件读写数据库文件的读写创建连接,连接MySQL数据保存 前期准备: #导入os模块 import os #获得当前路径地址 os.getcwd() # 更改文件路劲 os.chdir('F:\python\数据清洗\代码和数据') #设置最大显示列数 pd.set_option('display.max_columns', 20) #设置最大显示行数 pd.set_option('disp
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:61440
    • 提供者:weixin_38733787
  1. 数据清洗之 csv文件读写

  2. csv文件读写 pandas内置了10多种数据源读取函数,常见的就是CSV和EXCEL 使用read_csv方式读取。结果为dataframe格式 在读取csv文件时,文件名称尽量是英文 参数较多,可以自行控制,但很多时候用默认参数 读取csv时,注意编码,常用编码为utf-8、gbk、gbk2312和gb18030等 使用to_csv方法快速保存 import numpy as np import pandas as pd import os os.getcwd() 'D:\\Jupyte
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:133120
    • 提供者:weixin_38620314
  1. 数据清洗之 数据增加和删除

  2. 数据增加和删除 在数据中,直接添加列 使用df.insert方法在数据中添加一列 drop(labels, axis, inplace=True)方法(删除) labels表示删除的数据,axis表示作用轴,inplace=True表示是否对原数据生效 axis=0按行操作,axis=1按列操作 使用del函数直接删除其中一列 import pandas as pd import os import numpy as np os.getcwd() 'D:\\Jupyter\\notebook
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:66560
    • 提供者:weixin_38736652
  1. 数据清洗之 数据筛选

  2. 数据常用筛选方法 在数据中,选择需要的行或者列 基础索引方式,就是直接引用 ioc[行索引名称或者条件,列索引名称或者标签] iloc[行索引位置,列索引位置] import pandas as pd import os import numpy as np os.getcwd() 'D:\\Jupyter\\notebook\\Python数据清洗实战\\数据清洗之数据表处理' os.chdir('D:\\Jupyter\\notebook\\Python数据清洗实战\\数据') df
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:93184
    • 提供者:weixin_38713450
  1. 数据清洗之 高阶函数处理

  2. 高阶函数处理 在dataframe中使用apply方法,调用自定义函数对数据进行处理 函数apply,注意axis 可以使用astype函数对数据进行转换 可以使用map函数进行数据转换 import pandas as pd import numpy as np import os os.getcwd() 'D:\\Jupyter\\notebook\\Python数据清洗实战\\数据清洗之数据转换' os.chdir('D:\\Jupyter\\notebook\\Python数据清洗
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:38912
    • 提供者:weixin_38704835
  1. 数据清洗之 聚合函数使用

  2. 聚合函数使用 对分组对象使用agg聚合函数 Groupby.agg(func) 针对不同的变量使用不同的统计方法 import pandas as pd import numpy as np import os os.getcwd() 'D:\\Jupyter\\notebook\\Python数据清洗实战\\数据清洗之数据统计' os.chdir('D:\\Jupyter\\notebook\\Python数据清洗实战\\数据') df = pd.read_csv('online_or
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:49152
    • 提供者:weixin_38557370
  1. 数据清洗之 分组对象与apply函数

  2. 分组对象与apply函数 函数apply即可用于分组对象,也可以作用于dataframe数据 Groupby.apply(func) 需要注意axis=0和axis=1的区别 np.sum, axis=0 相当于计算每列的总和 np.sum, axis=1 相当于计算每行的总和 import pandas as pd import numpy as np import os os.getcwd() 'D:\\Jupyter\\notebook\\Python数据清洗实战\\数据清洗之数据统计
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:40960
    • 提供者:weixin_38522029
  1. python数据清洗实战入门笔记(一)numpy和pandas

  2. 第一章:数据清洗常用工具1.numpy常用数据结构常用清洗工具:numpy常用数据结构:Numpy常用方法数组访问方法练习(jupyter)代码下面是结果2.Numpy常用数据清洗函数数据的排序数据的搜索练习(jupyter)代码下面是结果3.Pandas常用数据结构series和dataframeseriesdataframe常用方法练习(jupyter)代码下面是结果 1.numpy常用数据结构 常用清洗工具: 目前在Python中, numpy和pandas是最主流的工具 Numpy中的向
  3. 所属分类:其它

    • 发布日期:2020-12-20
    • 文件大小:610304
    • 提供者:weixin_38722944
  1. python数据分析之Pandas数据结构和操作

  2. Pandas是什么?1、一个强大的分析结构化数据的工具集2、基础是NumPy,提供了高性能矩阵的运算3、应用在数学挖掘,数据分析。比如,学生成绩分析,股票数据分析等4、提供数据清洗功能Pands数据结构,主要分为两种,Series和DataFrame1、类似一维数组的对象2、通过list构建Seriesser_obj=pd.Series(rang(10))3、由数据和索引组成索引在左,数据在右索引是自动创建的4、获取数据和索引5、预览数据(取前几个)ser_obj.head(n)6、通过索引获取
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:258048
    • 提供者:weixin_38745434
  1. 干货:用Python进行数据清洗,这7种方法你一定要掌握

  2. 数据录入过程、数据整合过程都可能会产生重复数据,直接删除是重复数据处理的主要方法。pandas提供查看、处理重复数据的方法duplicated和drop_duplicates。以如下数据为例:发现重复数据通过duplicated方法完成,如下所示,可以通过该方法查看重复的数据。需要去重时,可drop_duplicates方法完成:drop_duplicates方法还可以按照某列去重,例如去除id列重复的所有记录:缺失值是数据清洗中比较常见的问题,缺失值一般由NA表示,在处理缺失值时要遵循一定的原
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:270336
    • 提供者:weixin_38725734
  1. 使用Pandas&NumPy进行数据清洗的6大常用方法

  2. 数据科学家花了大量的时间清洗数据集,并将这些数据转换为他们可以处理的格式。事实上,很多数据科学家声称开始获取和清洗数据的工作量要占整个工作的80%。因此,如果你正巧也在这个领域中,或者计划进入这个领域,那么处理这些杂乱不规则数据是非常重要的,这些杂乱数据包括一些缺失值,不连续格式,错误记录,或者是没有意义的异常值。在这个教程中,我们将利用Python的Pandas和Numpy包来进行数据清洗。主要内容如下:删除DataFrame中的不必要columns改变DataFrame的index使用.st
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:378880
    • 提供者:weixin_38704830
  1. Python数据清洗实践

  2. “数据科学家们80%的精力消耗在查找、数据清理、数据组织上,只剩于20%时间用于数据分析等。”——IBM数据分析数据清洗是处理任何数据前的必备环节。在你开始工作前,你应该有能力处理数据缺失、数据不一致或异常值等数据混乱情况。在开始做数据清洗前,需要对Numpy和Pandas库有基本的理解。数据清洗名如其意,其过程为标识并修正数据集中不准确的记录,识别数据中不可靠或干扰部分,然后重建或移除这些数据。数据清洗是数据科学中很少提及的一点,因为它没有训练神经网络或图像识别那么重要,但是数据清洗却扮演着非
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:345088
    • 提供者:weixin_38742453
  1. python数据分析之Pandas数据结构和操作

  2. Pandas是什么? 1、一个强大的分析结构化数据的工具集 2、基础是NumPy,提供了高性能矩阵的运算 3、应用在数学挖掘,数据分析。比如,学生成绩分析,股票数据分析等 4、提供数据清洗功能 Pands数据结构,主要分为两种,Series和DataFrame
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:236544
    • 提供者:weixin_38733414
  1. 使用Pandas&NumPy进行数据清洗的6大常用方法

  2. 数据科学家花了大量的时间清洗数据集,并将这些数据转换为他们可以处理的格式。事实上,很多数据科学家声称开始获取和清洗数据的工作量要占整个工作的80%。因此,如果你正巧也在这个领域中,或者计划进入这个领域,那么处理这些杂乱不规则数据是非常重要的,这些杂乱数据包括一些缺失值,不连续格式,错误记录,或者是没有意义的异常值。在这个教程中,我们将利用Python的Pandas和Numpy包来进行数据清洗。主要内容如下:删除DataFrame中的不必要columns 改变DataFrame的index
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:370688
    • 提供者:weixin_38537777
  1. Python数据清洗实践

  2. “数据科学家们80%的精力消耗在查找、数据清理、数据组织上,只剩于20%时间用于数据分析等。”——IBM数据分析数据清洗是处理任何数据前的必备环节。在你开始工作前,你应该有能力处理数据缺失、数据不一致或异常值等数据混乱情况。在开始做数据清洗前,需要对Numpy和Pandas库有基本的理解。数据清洗名如其意,其过程为标识并修正数据集中不准确的记录,识别数据中不可靠或干扰部分,然后重建或移除这些数据。数据清洗是数据科学中很少提及的一点,因为它没有训练神经网络或图像识别那么重要,但是数据清洗却扮演着非
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:345088
    • 提供者:weixin_38562492
  1. pandas数据清洗,排序,索引设置,数据选取方法

  2. 此教程适合有pandas基础的童鞋来看,很多知识点会一笔带过,不做详细解释 Pandas数据格式 Series DataFrame:每个column就是一个Series 基础属性shape,index,columns,values,dtypes,describe(),head(),tail() 统计属性Series: count(),value_counts(),前者是统计总数,后者统计各自value的总数 df.isnull() df的空值为True df.notnull() df的非空值为T
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:75776
    • 提供者:weixin_38713393
« 12 3 4 5 »