您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. python简单数据处理

  2. 此资源适用于python的简单数据处理,包括两个文件,一个是测试用的数据trait.xlsx表格,另一个是测试所用的实例脚本,有兴趣的可以尝试一下。
  3. 所属分类:其它

    • 发布日期:2020-05-02
    • 文件大小:19456
    • 提供者:weixin_43840576
  1. Python 中pandas索引切片读取数据缺失数据处理问题

  2. pandas是一个Python软件包,提供快速,灵活和富于表现力的数据结构,旨在使使用“关系”或“标记”数据既简单又直观。这篇文章主要介绍了pandas索引切片读取数据缺失数据处理,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-18
    • 文件大小:308224
    • 提供者:weixin_38630139
  1. 简单谈谈python基本数据类型

  2. 在Python中,能够直接处理的数据类型有以下几种:#整型 int,#浮点型 float,#布尔型 bool,#复数型 (在python中用小写 j ,表示虚部,用其他的字母不行)complex
  3. 所属分类:其它

    • 发布日期:2020-09-20
    • 文件大小:54272
    • 提供者:weixin_38603936
  1. Python制作数据预测集成工具(值得收藏)

  2. 大数据预测是大数据最核心的应用,是它将传统意义的预测拓展到“现测”。大数据预测的优势体现在,它把一个非常困难的预测问题,转化为一个相对简单的描述问题,而这是传统小数据集根本无法企及的。从预测的角度看,大数据预测所得出的结果不仅仅是用于处理现实业务的简单、客观的结论,更是能用于帮助企业经营的决策。 在过去,人们的决策主要是依赖 20% 的结构化数据,而大数据预测则可以利用另外 80% 的非结构化数据来做决策。大数据预测具有更多的数据维度,更快的数据频度和更广的数据宽度。与小数据时代相比,大数据预测
  3. 所属分类:其它

    • 发布日期:2020-12-17
    • 文件大小:167936
    • 提供者:weixin_38626032
  1. 详解python实现数据归一化处理的方式:(0,1)标准化

  2. 在机器学习过程中,对数据的处理过程中,常常需要对数据进行归一化处理,下面介绍(0, 1)标准化的方式,简单的说,其功能就是将预处理的数据的数值范围按一定关系“压缩”到(0,1)的范围类。 通常(0, 1)标注化处理的公式为: 即将样本点的数值减去最小值,再除以样本点数值最大与最小的差,原理公式就是这么基础。 下面看看使用python语言来编程实现吧 import numpy as np import matplotlib.pyplot as plt def noramlization(
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:58368
    • 提供者:weixin_38706747
  1. 浅析Python数据处理

  2. Numpy、Pandas是Python数据处理中经常用到的两个框架,都是采用C语言编写,所以运算速度快。Matplotlib是Python的的画图工具,可以把之前处理后的数据通过图像绘制出来。之前只是看过语法,没有系统学习总结过,本博文总结了这三个框架的API。 以下是这三个框架的的简单介绍和区别: Numpy:经常用于数据生成和一些运算 Pandas:基于Numpy构建的,是Numpy的升级版本 Matplotlib:Python中强大的绘图工具 Numpy Numpy快速入门教程
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:65536
    • 提供者:weixin_38571453
  1. Python简单实现socket信息发送与监听功能示例

  2. 本文实例讲述了Python简单实现socket信息发送与监听功能。分享给大家供大家参考,具体如下: 最近在研究boost C++库,用于工作中处理大规模高并发TCP连接数据响应,想测试,也可以用boost::asio库来写,但不利于测试代码的灵活修改。 于是就研究了一下python怎么做。学习过程中看到网上给出的代码示例虽然很基础易懂,对于python零基础的人来说,完全可以稍微复杂些,配上一些注释,就能更多掌握一些socket和python的基本语法知识。 于是根据我的使用需要,修改pytho
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:67584
    • 提供者:weixin_38634323
  1. Python使用pandas处理CSV文件的实例讲解

  2. Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。 CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。 我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在termin
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:189440
    • 提供者:weixin_38523618
  1. Python的pandas库+CSV文件处理详细使用,以及与一般Python处理操作对比

  2. Python的pandas库+CSV文件处理详细使用,以及与一般Python处理操作对比 下文来自与我阅读书籍《科学数据处理》的笔记,可能对于书上有些代码并不熟悉,所以留一些坑在这里,日后学会了就补上。如果大家原意留言解答,小白感激不尽。 以下都只是代码部分,相关注解会在我后续学习中进行补全,所以这个坑一定要来补! 1.读写CSV文件(1) 一般处理 #!/usr/bin/env python3 import sys #这个路径的设置是基于.py文件与需要处理的文件在同一个文件夹下 #如果不是这
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:56320
    • 提供者:weixin_38723691
  1. 数据处理之缺失值填充

  2. 点赞、关注再看,养成良好习惯 Life is short, U need Python 初学Python,快来点我吧 1. 概述 首先对数据缺失的原因、类型以及处理方法做一个简单地总结,如下图所示: 2. 直接删除法 当缺失值的个数只占整体很小一部分的时候,可直接删除缺失值(行)。但是如果缺失值占比比较大,这种直接删除缺失值的处理方法就会丢失重要信息。 直接删除法处理缺失值时,需要检测样本总体中缺失值的个数。Python中统计缺失值的方法如下(下面结合具体数据集,直接上代码): impor
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:460800
    • 提供者:weixin_38620893
  1. Python时间序列处理之ARIMA模型的使用讲解

  2. ARIMA模型 ARIMA模型的全称是自回归移动平均模型,是用来预测时间序列的一种常用的统计模型,一般记作ARIMA(p,d,q)。 ARIMA的适应情况 ARIMA模型相对来说比较简单易用。在应用ARIMA模型时,要保证以下几点: 时间序列数据是相对稳定的,总体基本不存在一定的上升或者下降趋势,如果不稳定可以通过差分的方式来使其变稳定。 非线性关系处理不好,只能处理线性关系 判断时序数据稳定 基本判断方法:稳定的数据,总体上是没有上升和下降的趋势的,是没有周期性的,方差趋向于一个稳定的
  3. 所属分类:其它

    • 发布日期:2021-01-01
    • 文件大小:67584
    • 提供者:weixin_38733333
  1. python使用pandas处理大数据节省内存技巧(推荐)

  2. 一般来说,用pandas处理小于100兆的数据,性能不是问题。当用pandas来处理100兆至几个G的数据时,将会比较耗时,同时会导致程序因内存不足而运行失败。 当然,像Spark这类的工具能够胜任处理100G至几个T的大数据集,但要想充分发挥这些工具的优势,通常需要比较贵的硬件设备。而且,这些工具不像pandas那样具有丰富的进行高质量数据清洗、探索和分析的特性。对于中等规模的数据,我们的愿望是尽量让pandas继续发挥其优势,而不是换用其他工具。 本文我们讨论pandas的内存使用,展示怎样
  3. 所属分类:其它

    • 发布日期:2021-01-01
    • 文件大小:880640
    • 提供者:weixin_38655682
  1. pyrad:Python雷达数据处理-源码

  2. 吡拉德 Python雷达数据处理 什么是派拉德? Pyrad是由MeteoSwiss和MeteoFrance开发的实时数据处理框架。该框架旨在离线和实时处理和可视化来自单个气象雷达以及笛卡尔合成产品的极地数据。它是用Python语言编写的。该框架受版本控制,并且基于doc字符串生成自动文档。它能够从瑞士的所有天气雷达中获取数据,即运行中的MeteoSwiss C波段rad4alp雷达网络,MeteoSwiss X波段DX50雷达和EPFL MXPol雷达以及OPERA文件格式的雷达数据。此外,
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:9437184
    • 提供者:weixin_42116672
  1. apache_beam-python:有关使用Apache Beam和Python进行批处理数据并行处理的演示项目-源码

  2. apache_beam-python 一个使用Apache Beam和Python进行批处理数据并行处理的演示项目 团队成员 介绍 Apache Beam是一个数据处理平台。 数据处理可以用于分析目的,也可以用于ETL。 而且,它不依赖于任何与执行引擎和数据无关,与程序无关的人。 工作流程 阿帕奇光束 Apache Beam提供了一个简单而强大的编程模型,用于构建批处理和流并行数据处理管道。 批管道:用于批量处理数据的管道类型。 流数据管道:这些管道实时实时处
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:26624
    • 提供者:weixin_42110469
  1. disk.frame:用于大于RAM数据的基于磁盘的快速并行数据处理框架-源码

  2. 磁盘框架 介绍 如何处理不适合随机存取存储器(RAM)的表格数据? 使用{disk.frame} ! 简而言之, {disk.frame}利用了两个简单的想法 将大于RAM的数据集分成多个块,并将每个块存储在文件夹内的单独文件中,然后 提供方便的API来操纵这些块 {disk.frame}的作用类似于分布式系统(例如Apache Spark,Python的Dask和Julia的JuliaDB.jl)用于中等数据,这些数据对于RAM而言太大,但不足以容纳大数据。 安装 您可以使用以下方法从安装
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:1048576
    • 提供者:weixin_42113552
  1. pyrealtime:Python中的实时数据处理和绘图管道-源码

  2. Py实时 PyRealtime是一个简化了构建实时管道系统Python的软件包。 它设计得足够简单,只需几行即可开始可视化数据,并且具有足够的可伸缩性以支持更复杂的工作流程。 它支持开箱即用的实时绘图(Matplotlib),串行通信(Pyserial)和套接字连接。 它采用了声明数据流的语法,您指定的管道应如何响应该装置,然后运行该管道。 例如,您可以仅三行就可以构建来自串行端口的实时数据图。 import pyrealtime as prt serial_layer = prt . S
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:46080
    • 提供者:weixin_42138703
  1. 一个兼容Python3 segwit的库,提供了以简单方式处理比特币数据结构的工具。- chainside / btcpy-源码

  2. developed with :red_heart_selector: by btcpy btcpy is a Python>=3.3 SegWit-compliant library which provides tools to handle Bitcoin data structures in a simple fashion. In particular, the main goal of this library is to provide a simple interface
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:35651584
    • 提供者:weixin_38721252
  1. Python 数据处理库 pandas 入门教程基本操作

  2. pandas是一个Python语言的软件包,在我们使用Python语言进行机器学习编程的时候,这是一个非常常用的基础编程库。本文是对它的一个入门教程。 pandas提供了快速,灵活和富有表现力的数据结构,目的是使“关系”或“标记”数据的工作既简单又直观。它旨在成为在Python中进行实际数据分析的高级构建块。 入门介绍 pandas适合于许多不同类型的数据,包括: 具有异构类型列的表格数据,例如SQL表格或Excel数据 有序和无序(不一定是固定频率)时间序列数据。 具有行列标签的
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:113664
    • 提供者:weixin_38622849
  1. 用Python实现数据的透视表的方法

  2. 在处理数据时,经常需要对数据分组计算均值或者计数,在Microsoft Excel中,可以通过透视表轻易实现简单的分组运算。而对于更加复杂的分组运算,Python中pandas包可以帮助我们实现。 1 数据 首先引入几个重要的包: import pandas as pd import numpy as np from pandas import DataFrame,Series 通过代码构造数据集: data=DataFrame({'key1':['a','b','c','a','c','a
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:52224
    • 提供者:weixin_38706055
  1. Python操作Elasticsearch处理timeout超时

  2. Elasticsearch 是一个分布式的开源搜索和分析引擎,适用于所有类型的数据,包括文本、数字、地理空间、结构化和非结构化数据。Elasticsearch 在 Apache Lucene 的基础上开发而成,由 Elasticsearch N.V.(即现在的 Elastic)于 2010 年首次发布 Elasticsearch 以其简单的 REST 风格 API、分布式特性、速度和可扩展性而闻名,是 Elastic Stack 的核心组件;Elastic Stack 是适用于数据采集、充实、存
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:60416
    • 提供者:weixin_38559992
« 12 3 4 5 6 7 8 9 10 ... 33 »