您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 小费数据集

  2. 利用Python进行数据分析,小费数据集。
  3. 所属分类:Python

    • 发布日期:2014-04-15
    • 文件大小:8192
    • 提供者:shengshengwang
  1. 利用Python做数据分析.mobi

  2. 《利用Python做数据 分析》,也叫《利用python进行数据分析》,是麦金尼创作的软硬件开发类书籍。 从pandas库的数据分析工具开始利用高性能工具对数据进行加载、清理、转换、合并以及重塑;利用matpIotlib创建散点图以及静态或交互式的可视化结果;利用pandas的groupby功能对数据集进行切片、切块和汇总操作;处理各种各样的时间序列数据。
  3. 所属分类:Python

    • 发布日期:2016-12-14
    • 文件大小:15738912
    • 提供者:woka_wifi
  1. 数据分析-大数据

  2. 从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。[2] 随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起
  3. 所属分类:网络基础

    • 发布日期:2017-09-06
    • 文件大小:458752
    • 提供者:woshihufeiyu
  1. Python for Data Analysis(高清原版)

  2. 《利用Python进行数据分析》内容简介:学习NumPy(NumericalPython)的基础和高级知识;从pandas库的数据分析工具开始利用高性能工具对数据进行加载、清理、转换、合并以及重塑;利用matpIotlib创建散点图以及静态或交互式的可视化结果;利用pandas的groupby功能对数据集进行切片、切块和汇总操作;处理各种各样的时间序列数据。
  3. 所属分类:Python

    • 发布日期:2017-10-20
    • 文件大小:16777216
    • 提供者:lion878
  1. 《利用python进行数据分析》数据集.rar

  2. 《利用python进行数据分析》中所用的CSV文件,用于各种python pandas以及其他第三方包的功能的展示。
  3. 所属分类:算法与数据结构

    • 发布日期:2020-03-25
    • 文件大小:638976
    • 提供者:pnd237
  1. 白皮书-Tableau企业级应用平台

  2. Tableau企业级应用平台的白皮书,供大家学习,希望有需要的朋友都能将Tableau应用到公司。新一代商业智能软件使需要的人可以掌握数据。对于商业用户或为其提供支持的团队, 缓慢、死板的系统已不敷使用。竟争压力和新的数据源在不断形成新的要求。用户要求能够 快速且方便地回答其问题。这是很棒的事情 Tableau software的创立理念在于,数据分析和后续报告不应是孤立的活动,而是应集成为 单一的可视化分析过程一该过程使用户可按照其思路快速査看其数据中的模式并动态切换视 图。 Tableau将
  3. 所属分类:管理软件

    • 发布日期:2019-10-31
    • 文件大小:2097152
    • 提供者:qinqichang
  1. 利用Python代码实现数据可视化的5种方法详解

  2. 前言 数据科学家并不逊色于艺术家。他们用数据可视化的方式绘画,试图展现数据内隐藏的模式或表达对数据的见解。更有趣的是,一旦接触到任何可视化的内容、数据时,人类会有更强烈的知觉、认知和交流。 数据可视化是数据科学家工作中的重要组成部分。在项目的早期阶段,你通常会进行探索性数据分析(Exploratory Data Analysis,EDA)以获取对数据的一些理解。创建可视化方法确实有助于使事情变得更加清晰易懂,特别是对于大型、高维数据集。在项目结束时,以清晰、简洁和引人注目的方式展现最终结果是非常
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:620544
    • 提供者:weixin_38540782
  1. Python数据分析神器——pandas(进阶教程)

  2. 文章目录合并数据集索引的合并轴向连接合并重叠数据重塑和轴向旋转重塑层次化索引将“长格式”旋转为“宽格式”数据转换移除重复数据利用函数或映射进行数据转换替换值重命名轴索引离散化和面元划分 合并数据集 pandas对象中的数据可以通过一些内置的方式进行合并: pandas.merge 可以根据一个或多个键将不同DataFrame中的行连接起来 pandas.concat 可以沿着一条轴将多个对象堆叠到一起 实例方法 combine_first 可以将重复数据连接在一起,用一个对象中的值填充另一个对
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:1002496
    • 提供者:weixin_38677306
  1. 利用Python+matplotlib对泰坦尼克号进行数据分析

  2. 主要分析有数据接:https://pan.baidu.com/s/1jn88GiOr7uWA8BDQocFXxg 密码: s0e0不同舱位等级中幸存者和遇难者的乘客比例不同性别的幸存比例幸存和遇难旅客的票价分布幸存和遇难乘客的年龄分布不同上船港口的乘客仓位等级分布幸存和遇难乘客堂兄弟姐妹的数量分布幸存和遇难旅客父母子女的数量分布单独乘船与否和幸存之间有没有联系是否成年男性和幸存之间有没有联系 数据接:https://pan.baidu.com/s/1jn88GiOr7uWA8BDQocFXxg
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:206848
    • 提供者:weixin_38539705
  1. 利用Python进行心脏病患者特征分析

  2. 今天要跟大家说到的一个数据集分析,是关于心脏病的。心脏病作为全球第一大杀手,是我们不得不提前防御的疾病。今天我们利用Python从一份心脏病数据集中找出一些规律,看下哪些特征对于确诊心脏病影响比较大,从而提醒我们注意平时的生活规律。 数据集介绍 数据分析之前,先得有数据集,首先先来介绍一下这份kaggle上下载的数据集。 对其中的字段进行分析: age:年龄。 sex:性别(1:男,0:女) cp:疼痛类型(1:典型心绞痛,2:*型心绞痛,3:非心绞痛,4:没有症状(不痛)) trestbp
  3. 所属分类:其它

    • 发布日期:2020-12-20
    • 文件大小:120832
    • 提供者:weixin_38752459
  1. 数据分析实战:利用python对心脏病数据集进行分析

  2. ↑ 关注 + 星标 ~ 有趣的不像个技术号 每晚九点,我们准时相约   我们都很害怕生病,但感冒发烧这种从小到大的疾病我们已经麻木了,因为一星期他就会好,但是随着长大,各种发炎、三高、心脏病、冠心病响应而生。 心脏病作为一种发作起来让人看了就觉得恐怖的疾病,每年不知道夺走多少生命。而那些患病健在的人们也必须在自己后续的生命里割舍太多东西,以防止心脏病发作。 没有得病的时候,我们永远觉得它离自己很远。我对心脏病的认知就是这样,我不知道它患病的原因,也不知哪些原因会引起心脏病。而患病后如何保持正常
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:565248
    • 提供者:weixin_38588854
  1. Analysis_Lyft_Bay_Wheels_System_Data:2018年1月至2019年9月Lyft湾轮的系统数据的Jupyter笔记本中的Python数据分析-源码

  2. Lyft Bay Wheels(fka Ford Go Bike)数据可视化项目 叶J 在Jupyter笔记本发现的完整分析 数据集 集(以前称为“ Ford GoBike”数据集)包含Lyft的Bay Area自行车共享数据,该数据由Lyft和以前的Ford(自行车系统的先前运营商)提供给公众。在Python(3.7.3版)和Jupyter笔记本中进行分析,同时利用流行的Python数据分析和数据科学包:pandas,numpy和matplotlib。另外,我还利用了geopy.distanc
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:5242880
    • 提供者:weixin_42116650
  1. Python大数据处理案例

  2. 分享知识要点:lubridate包拆解时间|POSIXlt利用决策树分类,利用随机森林预测利用对数进行fit,和exp函数还原训练集来自Kaggle华盛顿自行车共享计划中的自行车租赁数据,分析共享自行车与天气、时间等关系。数据集共11个变量,10000多行数据。https://www.kaggle.com/c/bike-sharing-demand首先看一下官方给出的数据,一共两个表格,都是2011-2012年的数据,区别是Test文件是每个月的日期都是全的,但是没有注册用户和随意用户。而Tra
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:206848
    • 提供者:weixin_38499349
  1. 利用Python进行数据分析——数据聚合与组操作

  2. 上图显示了一个分组背后的具体操作,当操作一个数据集按照某个key进行分组时,数据集首先会按组进行分割,然后再对每一组应用函数,最后返回分组后的结果。当需要按照多个key进行分组时,给groupby()传递一个列表即可,得到的结果是具有层级index的Series:当对整个数据集进行分组时,可以直接给groupby()传递key的值,此时不可再用loc()与iloc()方法,因为groupby()生成的是一个groupby对象,而不是DataFrame:另一个应用于groupby()之后的方法为s
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:625664
    • 提供者:weixin_38670707
  1. Election_Analysis:使用Python进行汤姆(Tom)的选举分析-源码

  2. 选举分析 项目概况 塞思(Seth)已利用Python的力量联系我们与汤姆(Tom)合作进行选举分析。 一旦Seth向Tom和团队提供了Python的基本介绍,我们就会被提供。 选举结果的csv数据集,建议与Tom一起检查并将其存储在Election_Analysis文件夹内的新文件夹资源中。 在此项目中,我们的最终Python脚本应能够在运行脚本时传递以下信息: 总投票数 获得选票的候选人的完整清单 每位候选人获得的总票数 每个候选人赢得的选票百分比 基于大众投票的选举获胜者 选举审核
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:7340032
    • 提供者:weixin_42098104
  1. frovedis:向量化和分布式数据分析框架-源码

  2. Frovedis: 分布式数据分析框架 1.简介 Frovedis是用于数据分析的高性能中间件。 它用C ++编写,并利用MPI在服务器之间进行通信。 它提供 类似Spark的API用于分布式处理 使用上述API的矩阵库 机器学习算法库 用于预处理的数据框 Spark / Python界面,易于使用 我们的主要目标体系结构是NEC的矢量计算机SX-Aurora TSUBASA。 这些库经过精心编写以支持矢量化。 但是,它们只是标准的C ++程序,可以在x86等其他体系结构上高效运行。 机器学
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:34603008
    • 提供者:weixin_42100971
  1. OsmnxProjectDemo:利用Python的Osmnx程序库分析城市道路网络,并利用相关函数进行可视化展示-源码

  2. OsmnxProjectDemo 复杂网络与社会网络分析大作业 利用python的开源第三方库Osmnx ,结合旧金山的出租车轨迹数据集和旧金山的驱动道路网络,进行了一些分析,将结果可视化出来 注意:第一次运行此代码时,替换程序中的代码注释去掉 出租车的轨迹数据集保存在cabspottingdata文件夹中 cabspottingdata文件夹中的每个一个txt文件(除去一个记录了所有车的编号的txt文件)表示插入车辆移位的轨迹, txt文件名即为车辆的唯一标记编号, txt文件里面的每个行数据
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:101711872
    • 提供者:weixin_42175971
  1. 电影评级和预测模型:该项目的目的是利用IMDB数据集生成有意义和有趣的见解,然后根据平均IMDB评级和用户鸣叫的情绪分析得分来创建电影评级模型。 并创建准确的机器学习模型,以基于一些关键功能预测平均电影收视率-源码

  2. 电影分级和预测模型 目的 该项目的目的是利用IMDB数据集生成有意义和有趣的见解,然后基于IMDB的平均评分和用户鸣叫的情感分析得分来创建电影评分模型。 还要创建一个准确的机器学习模型,根据一些关键功能预测平均电影收视率,并通过使用大数据技术进行数据处理来使系统具有可扩展性,然后将系统托管在Google Cloud上。 使用的技术 火花 齐柏林飞艇 朱皮特 Twitter API Google Cloud Engine 情感分析(文本斑点) Python HTML5 CSS3 Java
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:8388608
    • 提供者:weixin_42098104
  1. Python大数据处理案例

  2. 分享知识要点: lubridate包拆解时间|POSIXlt 利用决策树分类,利用随机森林预测 利用对数进行fit,和exp函数还原训练集来自Kaggle华盛顿自行车共享计划中的自行车租赁数据,分析共享自行车与天气、时间等关系。数据集共11个变量,10000多行数据。 https://www.kaggle.com/c/bike-sharing-demand首先
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:201728
    • 提供者:weixin_38673548
  1. 利用Python进行数据分析——数据聚合与组操作

  2. 上图显示了一个分组背后的具体操作,当操作一个数据集按照某个key进行分组时,数据集首先会按组进行分割,然后再对每一组应用函数,最后返回分组后的结果。 当需要按照多个key进行分组时,给groupby()传递一个列表即可,得到的结果是具有层级index的Series: 当对整个数据集进行分组时,可以直接给groupby()传递key的值,此时不可再用loc()与iloc()方法,因为groupby()生成的是一个groupby对象,而不是DataFrame:
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:614400
    • 提供者:weixin_38502183
« 12 3 »