您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 菊安酱的机器学习第1期-k-近邻算法(直播).pdf

  2. k-近邻算法的课件。来自于菊安酱的机器学习实战12期的免费教程。内涵python源码。菊安酱的直播间: 我们已经知道k近邻算法的工作原理,根据特征比较,然后提取样本集中特征最相似数据(最近邻)的分类标签。 那么如何进行比较呢?比如表1中新出的电影,我们该如何判断他所属的电影类别呢?如图2所示。 电影分类 120 爱情片(1,101) 爱情片(12,97) 80 爱情片(5,89) 水弊 60 ?(24,67) 动作片(112,9 20 动作片(1158) 动作片(108,5) 0 20 60 8
  3. 所属分类:讲义

    • 发布日期:2019-07-27
    • 文件大小:867328
    • 提供者:qiu1440528444
  1. pandas参数设置的实用小技巧

  2. 前言 在日常使用pandas的过程中,由于我们所分析的数据表规模、格式上的差异,使得同样的函数或方法作用在不同数据上的效果存在差异。 而pandas有着自己的一套参数设置系统,可以帮助我们在遇到不同的数据时灵活调节从而达到最好的效果,本文就将介绍pandas中常用的参数设置方面的知识。 图1 1 设置DataFrame最大显示行数 pandas设置参数中的display.max_rows用于控制打印出的数据框的最大显示行数,我们使用pd.set_option()来有针对的设置参数,如下面的例子:
  3. 所属分类:其它

    • 发布日期:2020-12-16
    • 文件大小:283648
    • 提供者:weixin_38720390
  1. pandas入门

  2. 文章目录数据结构Series属性:生成 Series:检查缺失值:DataFrame构建DataFrame:基本操作:索引,选择,增删基本功能重建索引*df.reindex()*删除行或列算术方法逐元素应用函数排序描述性统计 概述 处理表格型数据,每一列数据类型可以不一样 导入:import pandas as pd from pandas import Series,DataFrame 常用显示选项: pd.options.display.max_rows = n :设置pd对象的显示行数,
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:378880
    • 提供者:weixin_38560797
  1. pyecharts 在地图上打点碰到的坑

  2. 版本 pyecharts v1 版本 碰到的问题 由于自己的数据 和pyecharts地图数据不一致, 当输入pyecharts不存在的地点时Geo就会报错, 而且还不提示是哪一个地点造成的, 此问题困扰了我好几天 解决办法 看官方文档的时候注意了下面一句话 Geo 图的坐标引用自 pyecharts.datasets.COORDINATES,COORDINATES 是一个支持模糊匹配的字典类。可设置匹配的阈值。 所以有了我自己的想法, 那我自己的地点数据先去匹配COORDINATES,匹配上的
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:145408
    • 提供者:weixin_38679178
  1. 数据预处理及特征工程

  2. 1.异常值处理 通过箱线图(或 3-Sigma)删除异常值或设置为缺失值; 长尾截断; 以下代码是根据箱线图处理异常值封装的函数: def outliers_proc(data, col_name, scale=3): """ 用于清洗异常值,默认用 box_plot(scale=3)进行清洗 :param data: 接收 pandas 数据格式 :param col_name: pandas 列名 :param scale: 尺度 :retur
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:110592
    • 提供者:weixin_38744778
  1. [Python3] Pandas —— (三) 层级索引

  2. 文章目录五、层级索引(一)多级索引Series1. 低效方法:用Python元组表示索引2. 高效方法:Pandas多级索引3. 高维数据的多维索引(二)多级索引的创建方法1. 显式地创建多级索引2. 多级索引的等级名称3. 多级列索引(三)多级索引的取值和切片1. Series多级索引2. DataFrame多级索引(四)多级索引行列转换1. 有序的索引和无序的索引2. 索引stack与unstack3. 索引的设置与重置(五)多级索引的数据累计方法 五、层级索引 对于存储多维数据的需求,数
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:91136
    • 提供者:weixin_38701683
  1. data-cleaning-project-onl01-dtsc-ft-012120-源码

  2. 项目-数据清理 介绍 在本实验中,我们将利用我们了解到的有关熊猫,数据清理和探索性数据分析的所有信息。 为了完成本实验,您必须导入,清理,合并,重塑和可视化数据,以回答所提供的问题以及您自己的问题! 目标 你将能够: 使用不同类型的联接来合并DataFrame 使用内置方法识别数据框中的缺失值 评估并执行最佳策略,以处理给定数据集的缺失,重复和错误值 检查数据是否有重复或多余的值并将其删除 数据集 在本实验中,我们将使用全面的,该可在Kaggle上找到! 入门 在下面的单元格中: 将pan
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:90112
    • 提供者:weixin_42143092
  1. SQLAlchemyChallenge-源码

  2. SQLAlchemy家庭作业-冲浪! 步骤1-气候分析与探索 首先,使用Python和SQLAlchemy对您的气候数据库进行基本的气候分析和数据探索。 以下所有分析都应使用SQLAlchemy ORM查询,Pandas和Matplotlib完成。 使用SQLAlchemy create_engine连接到您的sqlite数据库。 使用SQLAlchemy automap_base()将表反映到类中,并保存对这些名为Station和Measurement类的引用。 通过创建SQLAlche
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:2048
    • 提供者:weixin_42127783
  1. SQLAlchemy_Flask_App_Climate_Analysis-源码

  2. SQLAlchemy / Flask App-气候分析 气候分析与探索 我使用Python和SQLAlchemy进行了气候数据库的基本气候分析和数据探索。 使用SQLAlchemy ORM查询,Pandas和Matplotlib完成了分析。 我已经使用SQLAlchemy create_engine连接到我的sqlite数据库。 我已经使用SQLAlchemy automap_base()将表反映到类中,并保存了对这些名为Station和Measurement类的引用。 步骤1:降水分析 我
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:453632
    • 提供者:weixin_42131890
  1. sqlalchemy-challenge:使用Python(Pandas,Matplotlib),SQLAlchemy(ORM查询)和Flask进行气候数据库的气候分析和数据探索-源码

  2. SQLAlchemy:冲浪! 背景 使用Python(Pandas,Matplotlib),SQLAlchemy(ORM Queries)和Flask对气候数据库进行气候分析和数据探索 目标 步骤1-气候分析与探索 使用Python和SQLAlchemy对气候数据库进行基本的气候分析和数据探索。 以下所有分析都应使用SQLAlchemy,Pandas和Matplotlib完成。 降水分析 设计查询以检索最近12个月的降水数据。 仅选择日期和prcp值。 将查询结果加载到Pandas Data
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:4194304
    • 提供者:weixin_42121086
  1. Pandas-SalesData-Tasks:将销售数据与Pandas一起使用的数据分析任务-源码

  2. 熊猫销售数据任务 使用Python Pandas库完成的一组现实世界数据科学任务。 设置 安装Jupyter Notebook: ://jupyter.readthedocs.io/en/latest/install.html 安装熊猫库: : 信息: 我们使用Python Pandas和Python Matplotlib分析和回答有关12个月销售数据的业务问题。 该数据包含按月,产品类型,成本,购买地址等细分的数十万个电子商店购买。 我们首先清理数据。 本节中的任务包括: 从Dat
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:4194304
    • 提供者:weixin_42123296
  1. NumPy-nad-Pandas的第一步:与Pandas的第一个项目程序-源码

  2. NumPy-nad-Pandas的第一步 根据缓冲罐废水分析的结果,我准备了“ Buffer_Tank_data.csv”文件。 基于特定参数的值,程序将生成一个图表,显示这些值随时间的变化。 从数据中为特定参数生成图表 读取一个csv文件。 csv文件没有标题,因此将header参数设置为None。 通过设置df.columns属性显式设置每个列的名称 有关数据框的一些方法。 创建一个将字符串对象转换为日期格式的函数。 使用上述功能来格式化“日期/日期”列中的值 更改熊猫生成的自动增
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:36864
    • 提供者:weixin_42144366
  1. Pandas库之DataFrame使用的学习笔记

  2. 1 简介 DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表。 或许说它可能有点像matlab的矩阵,但是matlab的矩阵只能放数值型值(当然matlab也可以用cell存放多类型数据),DataFrame的单元格可以存放数值、字符串等,这和excel表很像。 同时DataFrame可以设置列名columns与行名index,可以通过像matlab一样通过位置获取数据也可以通过列名和行名定位,具体方法在后面细说。 2 创建DataFrame 首先声
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:240640
    • 提供者:weixin_38516270
  1. dataframe设置两个条件取值的实例

  2. 如下所示: >>> import pandas as pd >>> import numpy as np >>> from pandas import Series, DataFrame >>> df = DataFrame({'name':['a','a','b','b'],'classes':[1,2,3,4],'price':[11,22,33,44]}) >>> df classes name
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:47104
    • 提供者:weixin_38581777
  1. python设置值及NaN值处理方法

  2. 如下所示: python 设置值 import pandas as pd import numpy as np dates = pd.date_range('20180101',periods=6) df = pd.DataFrame(np.arange(24).reshape(6,4),index=dates,columns=['A','B','C','D']) print(df) A B C D 2018-01-01 0 1 2 3 2018-01-02 4 5 6 7 2018
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:30720
    • 提供者:weixin_38661800
  1. Python DataFrame 设置输出不显示index(索引)值的方法

  2. 在输出代码行中,加入“index=False”如下: m_pred_survived.to_csv(clasified.csv,index=False) 以上这篇Python DataFrame 设置输出不显示index(索引)值的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持软件开发网。 您可能感兴趣的文章:Python将DataFrame的某一列作为index的方法pandas将DataFrame的列变成行索引
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:28672
    • 提供者:weixin_38586428
  1. pandas数据清洗,排序,索引设置,数据选取方法

  2. 此教程适合有pandas基础的童鞋来看,很多知识点会一笔带过,不做详细解释 Pandas数据格式 Series DataFrame:每个column就是一个Series 基础属性shape,index,columns,values,dtypes,describe(),head(),tail() 统计属性Series: count(),value_counts(),前者是统计总数,后者统计各自value的总数 df.isnull() df的空值为True df.notnull() df的非空值为T
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:75776
    • 提供者:weixin_38713393
  1. pandas DataFrame 根据多列的值做判断,生成新的列值实例

  2. 环境:Python3.6.4 + pandas 0.22 主要是DataFrame.apply函数的应用,如果设置axis参数为1则每次函数每次会取出DataFrame的一行来做处理,如果axis为1则每次取一列。 如代码所示,判断如果城市名中含有ing字段且年份为2016,则新列test值赋为1,否则为0. import numpy as np import pandas as pd data = {'city': ['Beijing', 'Shanghai', 'Guangzhou',
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:111616
    • 提供者:weixin_38629274
  1. 对pandas将dataframe中某列按照条件赋值的实例讲解

  2. 在数据处理过程中,经常会出现对某列批量做某些操作,比如dataframe df要对列名为“values”做大于等于30设置为1,小于30设置为0操作,可以这样使用dataframe的apply函数来实现, 具体实现代码如下: def fun(x): if x >= 30: return 1 else: return 0 values= feature['values'].apply(lambda x: fun(x)) 具体的逻辑可以修改fun函数来实现,但是按照某些条件选择列不是
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:36864
    • 提供者:weixin_38618540
  1. Pandas设置值

  2. 我们可以根据自己的需求, 用 pandas 进行更改数据里面的值, 或者加空行,或者有数值的列。 (1)创建DataFrame import pandas as pd import numpy as np # index行索引,columns列索引 dates = pd.date_range('20180101', periods=6) df = pd.DataFrame(np.random.randn(6,4), index=dates, columns= ['A', 'B', 'C
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:31744
    • 提供者:weixin_38673924
« 12 »