您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. food_info+titanic_train+fandango_score_comparison

  2. 该资源的内容是 food_info.csv 、titanic_train.csv和fandango_score_comparison.csv三个文件的集合。是我的博客《深度学习笔记之(四)Python数据处理库pandas》使用数据库。资源来源于网络。
  3. 所属分类:其它

    • 发布日期:2018-11-04
    • 文件大小:528384
    • 提供者:plsong_csdn
  1. pandas处理美国人口数据案例.rar

  2. 数据为千锋教育数据分析与人工智能教学视频中涉及的美国人口案例数据CSV文件。可以根据此数据进行实验,帮助大家更好的掌握python中pandas库的使用情况
  3. 所属分类:机器学习

    • 发布日期:2020-03-18
    • 文件大小:18432
    • 提供者:kenanlp
  1. 文本分类语料库(复旦)测试语料

  2. 文本分类语料库(复旦)测试语料 由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。 经过数据清理将训练和测试合并成一个csv文件,可以用pandas.read_csv直接读取,分为两列分别是类别和
  3. 所属分类:互联网

    • 发布日期:2020-05-29
    • 文件大小:274726912
    • 提供者:xmrzh
  1. Python 数据的累加与统计的示例代码

  2. 问题 你需要处理一个很大的数据集并需要计算数据总和或其他统计量。 解决方案 对于任何涉及到统计、时间序列以及其他相关技术的数据分析问题,都可以考虑使用 Pandas库 。 为了让你先体验下,下面是一个使用Pandas来分析芝加哥城市的 老鼠和啮齿类动物数据库 的例子。 在我写这篇文章的时候,这个数据库是一个拥有大概74,000行数据的CSV文件。 >>> import pandas >>> # Read a CSV file, skipping last l
  3. 所属分类:其它

    • 发布日期:2020-12-17
    • 文件大小:55296
    • 提供者:weixin_38518958
  1. Python数据可视化实现漏斗图过程图解

  2. 项目实现知识点: Pandas库及pyecharts库 Pandas:数据分析和处理工具。 pd.read_csv():读取csv文件。 pyecharts:绘图库,提供30多种图标,超过400个以上的地图文件,支持原生百度地图,为地理数据可视化提供支持。 pyecharts.charts:提供了基本的图表,例如条形图、直方图等。 Python数据可视化:漏斗图的制作 项目实现过程: 1.导入模块 2.打开文件 3.读取数据 4.整理数据 5.创建漏斗图
  3. 所属分类:其它

    • 发布日期:2020-12-17
    • 文件大小:137216
    • 提供者:weixin_38650150
  1. Python使用pandas处理CSV文件的实例讲解

  2. Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。 CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。 我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在termin
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:189440
    • 提供者:weixin_38523618
  1. Python的pandas库+CSV文件处理详细使用,以及与一般Python处理操作对比

  2. Python的pandas库+CSV文件处理详细使用,以及与一般Python处理操作对比 下文来自与我阅读书籍《科学数据处理》的笔记,可能对于书上有些代码并不熟悉,所以留一些坑在这里,日后学会了就补上。如果大家原意留言解答,小白感激不尽。 以下都只是代码部分,相关注解会在我后续学习中进行补全,所以这个坑一定要来补! 1.读写CSV文件(1) 一般处理 #!/usr/bin/env python3 import sys #这个路径的设置是基于.py文件与需要处理的文件在同一个文件夹下 #如果不是这
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:56320
    • 提供者:weixin_38723691
  1. Pandas基础–数据结构和索引操作

  2. Pandas基础 引言 Pandas是基于Numpy的库,但功能更加强大,Numpy专注于数值型数据的操作,而Pandas对数值型,字符串型等多种格式的表格数据都有很好的支持。 内容介绍 1.数据结构(Series,DataFrame,Panel) 2.索引操作 3.数据运算 4.层次化索引 5.可视化(暂时忽略) 6.示例1 7.外部数据的读取与存储(csv,txt,json,excel,数据库,web数据) 8.示例2 9.数据清洗与整理 10.示例3 11.数据分组与聚合 12.示例4 1
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:154624
    • 提供者:weixin_38629362
  1. 使用Python(pandas库)处理csv数据

  2. (注:本文写于做毕设期间,有处理大量csv文件的需要,故使用python强大的库资源来处理数据,希望对有需要的你提供帮助和启发) 使用Python(pandas)处理数据 原始数据和处理之后的样式 图中为一个csv文件,待处理的csv文件总共有2410个 原始数据 处理样式 1.导入os、pandas和numpy库 import os import pandas as pd import numpy as np 2.筛选出csv文件中的指定行(列) time = pd.read_csv(in
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:675840
    • 提供者:weixin_38640443
  1. Python数据可视化学习笔记:第一章 关联图 第四节 使用Python绘制一般气泡图

  2. 前言 声明:这个系列的博文都是我自己学习所得的东西,秉承着每天进步一点点的理念进行学习,我参考的课程是《菊安酱与菜菜的Python机器学习可视化50图》,使用的Python版本为3.6.4。 今天学习的内容气泡图的绘制,这种图与散点图有很多相似之处,所以可以借鉴散点图的代码进行制作。 分步骤解析气泡图的绘制方法 1.我们在复杂散点图绘制的基础上对代码进行修改,使之变为气泡图,原始代码如下: import numpy as np #数学处理库 import pandas as pd #用于处理.
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:633856
    • 提供者:weixin_38652196
  1. matplotlib 图形化分析猪肉价格上涨趋势,pandas数据处理

  2. 1.爬取新发地果蔬价格csv,上一张的内容,爬取新发地果蔬价格保存为CSV格式,筛选出毛猪白条猪, 2.筛选分析猪肉的价格,利用matplotlib库生产趋势图. #pandas import pandas as pd #导入数据处理工具pandas import matplotlib.pyplot as plt#导入图形化显示工具matplotlib dataframe = pd.read_csv(新发地菜价.csv,header=None) #print(dataframe) #拿到数据
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:109568
    • 提供者:weixin_38516706
  1. disaster-response-pipeline:这是Udacity与图8合作开发的数据科学纳米学位计划的一个项目。 该项目的目的是建立一个模型,以实时对按摩进行分类-源码

  2. 灾害响应管道项目 目录 项目动机 该项目是Udacity与数据八合作的数据科学纳米学位计划的一部分。 数据集包含预先标记的推文和来自现实生活灾难事件的消息。 目的是设计一个模型,以对所有36种预定义类别的按摩进行分类,然后将其发送给相应的救灾机构。 要求 使用带有以下库的Python版本3,该代码应该没有问题地运行: 机器学习:NumPY,Scipy,Pandas,sklearn 自然语言处理:NLTK SQLite数据库:SQLalchemy 模型加载和保存:泡菜 Web应用程序和数据
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:23068672
    • 提供者:weixin_42109639
  1. hse_test_task:该服务处理XLSXCSV文件并将其存储到PostgreSQL数据库-源码

  2. XLSX / CSV文件处理服务 描述 该服务接受.xlsx或.csv格式的文件作为输入,将其解析为Pandas DataFrame结构(读取时,可以使用表头指定行的索引),对表进行预处理(如果需要)(识别日期,重命名表列,设置列数据类型)。 下一步是将表加载到PostgreSQL数据库中。 在初始插入过程中,将建立表的主键。 在重复插入到现有表的过程中,假设表名,列名和列数据类型匹配,则将数据添加到表的末尾。 (可选)您可以在指定的列上设置索引。 发射 克隆此存储库: https://gith
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:10240
    • 提供者:weixin_42134285
  1. Rainfall_Data:将降雨数据从csv格式处理为更易读的数据-源码

  2. 降雨数据处理 在此存储库中,我们使用了Pandas和Docker创建了一种工具,可以将.csv格式的降雨数据处理为更易读的数据。 rainfall.csv文件包含2020年10月12日星期一在英格兰和威尔士周围的倾卸式雨量计上超过15分钟的窗口记录的rainfall.csv读数(以毫米为单位)。 dateTime :15分钟降雨窗口的日期和时间,其读数有效。 station :UK Environment Agency API中站点数据的URL。 stationReference :短站
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:471040
    • 提供者:weixin_42129300
  1. pdpcli:PdpCLI是pandas DataFrame处理CLI工具,使您可以从配置文件构建pandas管道-源码

  2. PdpCLI 快速链接 介绍 PdpCLI是pandas DataFrame处理CLI工具,使您可以从配置文件中构建由支持的pandas管道。 您还可以使用自己的python脚本来扩展管道阶段和数据读取器/写入器。 特征 从CLI处理pandas DataFrame而无需编写Python脚本 支持多种配置文件格式:YAML,JSON,Jsonnet 读取/写入以下格式的数据文件:CSV,TSV,JSONL,XLSX 可扩展的管道和数据读取器/写入器 安装 使用pip安装库很简单。 $ pi
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:48128
    • 提供者:weixin_42162171
  1. 具有K均值聚类和DBSCAN的CitiBike数据网络分析-源码

  2. 具有K均值聚类和DBSCAN的CitiBike数据网络分析 该存储库使用网络科学方法和聚类技术检查CitiBike数据。 该数据可在上获得,而行程历史数据可在 。 csv.zip 2019年11月5日,05:10:56 pm用于此实验)。 使用K-means聚类和DBSCAN对自行车站网络进行进一步分析。 该文件包含以下属性-行程持续时间(秒),开始时间和日期,停止时间和日期,开始站点,名称,结束站点名称,站点ID,站点纬度/经度,自行车ID,用户类型(客户= 24小时通行证或3天通行证用户;
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:231424
    • 提供者:weixin_42151036
  1. 数据集:with具有快速,易于使用和高效的数据处理工具的ML模型最大的即用型NLP数据集中心-源码

  2. :hugging_face:Datasets是一个轻量级的库,提供两个主要功能: 一线数据加载器,可用于许多公共数据集:一线可下载和预处理任何 上提供的主要公共数据集(使用467种语言和方言!)。 使用像squad_dataset = load_datasets("squad")这样的简单命令,即可将这些数据集中的任何一个准备好在数据加载器中用于训练/评估ML模型(Numpy / Pandas / PyTorch / TensorFlow / JAX), 高效的数据预处理:对上述公共数据集以
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:28311552
    • 提供者:weixin_42131424
  1. Python—-数据预处理代码实例

  2. 本文实例为大家分享了Python数据预处理的具体代码,供大家参考,具体内容如下 1.导入标准库 import numpy as np import matplotlib.pyplot as plt import pandas as pd 2.导入数据集 dataset = pd.read_csv('data (1).csv') # read_csv:读取csv文件 #创建一个包含所有自变量的矩阵,及因变量的向量 #iloc表示选取数据集的某行某列;逗号之前的表示行,之后的表示列;冒号表示选
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:52224
    • 提供者:weixin_38688906
  1. python 处理dataframe中的时间字段方法

  2. 在机器学习过程中,通常会通过pandas读取csv文件,保持成dadaframe格式,然而有时候需要对dataframe中的时间字段进行数据建模,比如时间格式为datetime,那么像一般操作dataframe的方式来操作时间字段会报错的,所以在使用sklearn库进行fit和predict的时候,通常要把时间字段首先转换为timestamp格式,在fit和predict之后,如果需要matplotlib绘图的时候,再把timestamp格式转换为时间字符串,比如2017-02-01 14:25
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:40960
    • 提供者:weixin_38519849
  1. Tensorflow2.0泰坦尼克数据集的python分析以及离散化数据处理(含数据集下载地址)

  2. 泰坦尼克数据集下载 训练集 测试集 导入需要的库 import matplotlib.pyplot as plt %matplotlib inline import numpy as np import pandas as pd 加载数据集 train_file = './data/titanic/train.csv' eval_file = './data/titanic/eval.csv' train_df = pd.read_csv(train_file) eval_df = pd.re
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:98304
    • 提供者:weixin_38594266
« 12 »