您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 2017年最新机器学习入门与实战精品高清全套视频教程附讲义作业(anaconda2 4.3Pytyhon2.7 jupyter) 70课

  2. 2017年最新机器学习入门与实战精品高清全套视频教程附讲义作业(anaconda2 4.3Pytyhon2.7 jupyter) 70课 课程介绍: 从基本的软件安装到必备的Python扩展讲起,然后对机器学习算法一一讲解,同时配合编程实操的实现过程,适合零基础系统学习,配套资料包括讲义作业软件数据都有。 课程目录: 第一章Numpy前导介绍 1.1、Anconda安装 1.2、JupyterNoteBook 1.3、Numpy介绍+ndarry 1.4、ndarry的shape属性巧算 1.
  3. 所属分类:机器学习

    • 发布日期:2018-05-04
    • 文件大小:2048
    • 提供者:happyzhangdi008
  1. 菊安酱的机器学习第1期-k-近邻算法(直播).pdf

  2. k-近邻算法的课件。来自于菊安酱的机器学习实战12期的免费教程。内涵python源码。菊安酱的直播间: 我们已经知道k近邻算法的工作原理,根据特征比较,然后提取样本集中特征最相似数据(最近邻)的分类标签。 那么如何进行比较呢?比如表1中新出的电影,我们该如何判断他所属的电影类别呢?如图2所示。 电影分类 120 爱情片(1,101) 爱情片(12,97) 80 爱情片(5,89) 水弊 60 ?(24,67) 动作片(112,9 20 动作片(1158) 动作片(108,5) 0 20 60 8
  3. 所属分类:讲义

    • 发布日期:2019-07-27
    • 文件大小:867328
    • 提供者:qiu1440528444
  1. 大数据可视化--联通用户活动规律可视化样本数据csv文件

  2. 【知识准备】 探索性数据分析的基本原理和方法;Python语言及相关包的运用;Pandas;Numpy;Matplotlib;Seaborn;Scikit-Leart。 【实训要求】 1、观察样本数据的结构和数据特征; 2、读取样本数据,观察样本数据结构和头尾各10行数据; 3、对样本数据进行分析,找出业务数据中的分布规律; 4、用可视化方法对分析结果进行展示。 5、观察并找出每个特征的样本数据的缺失值和异常值等并提出解决办法; 6、对样本数据进行预处理; 7、采集样本数据存入HBase数据库(
  3. 所属分类:Hadoop

    • 发布日期:2020-07-05
    • 文件大小:345088
    • 提供者:qq_38132105
  1. pandas处理csv文件的方法步骤

  2. 一、我的需求 对于这样的一个 csv 表,需要将其 (1)将营业部名称和日期和股票代码进行拼接 (2)对于除了买入金额不同的的数据需要将它们的买入金额相加,每个买入金额乘以买卖序号的符号表示该营业名称对应的买入金额 比如:xx公司,20190731,1,股票1,4000,C20201010,xxxx 我这里想要的结果是:xx公司2019713C20201010,4000 二、代码 (1)首先由于文件是 gbk,所以读取是需要注意 encoding (2)日期是int类型,所以需要转化为 字符串
  3. 所属分类:其它

    • 发布日期:2020-12-16
    • 文件大小:67584
    • 提供者:weixin_38611388
  1. Python处理JSON数据并生成条形图

  2. 一、JSON 数据准备 首先准备一份 JSON 数据,这份数据共有 3560 条内容,每条内容结构如下: 本示例主要是以 tz(timezone 时区) 这一字段的值,分析这份数据里时区的分布情况。 二、将 JSON 数据转换成 Python 字典 代码如下: 三、统计 tz 值分布情况,以“时区:总数”的形式生成统计结果 要想达到这一目的,需要先将 records 转换成 DataFrame,DataFrame 是 Pandas 里最重要的数据结构,它可以将数据以表格的形式表示;然后用 v
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:417792
    • 提供者:weixin_38570459
  1. Pandas数据处理(一)

  2. Pandas数据处理(一) import pandas as pd import numpy as np #利用numpy生成一组DataFrome数据 df=pd.DataFrame(np.arange(16).reshape(4,4)) print(df) –out 0 1 2 3 0 0 1 2 3 1 4 5 6 7 2 8 9 10 11 3 12 13 14 15 #我们看到有一行,竖我们没有指定没结果却出现了, #那因
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:31744
    • 提供者:weixin_38693753
  1. Python基础知识总结笔记(七)常用第三方库

  2. Python基础知识总结笔记(七)常用第三方库 argparse:命令行参数解析库 pillow:图片处理库–灰度化 requests:处理web请求库 psutil ——性能测试框架(ps命令显示当前进程状态) redis库——做缓存以及任务队列分发 peewee访问数据库 numpy数据分析、机器学习——做数组 pandas数据分析与绘图——二维表格 matplotlib绘图 scrapy爬虫框架 sklearn 分类回归,数据分析回归工程 tensorflow 神经网络 1. argpa
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:98304
    • 提供者:weixin_38679233
  1. pyqt5 的多线程(QThread)遇到的坑(二)

  2. 前言 前面在pyqt5多线程(QThread)遇到的坑(一)中提到了先实例化类,再把实例对象传参到线程类,这样的确实可行,但是还是遇到了新坑。 pyqt5多线程(QThread)遇到的坑(一 起因 被实例化的类是做数据处理的,传入和导出的的数据比较大,最少都是几万行的excel表格数据(pandas.DataFrame),而且传入的数据最少两个pandas.DataFrame表,多的时候会传入7个,而且有一些数据是公共数据,每次处理都必须处理的,直接放在数据处理类的初始化__init__中了,而
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:61440
    • 提供者:weixin_38577261
  1. qiuzitao机器学习(六)

  2. 机器学习实战–信用卡欺诈检测项目 学校大三校企合作的课程设计项目 一、任务基础 拿到的信用卡数据集是由欧洲人于2013年9月使用信用卡进行交易的数据。此数据集显示两天内发生的交易,其中284807笔交易中有492笔被盗刷。特征’Class’是响应变量,如果发生被盗刷,则取值1,否则为0。 项目的目的是完成数据集中正常交易数据和异常交易数据的分类,并对测试数据进行预测。 数据集链接:https://pan.baidu.com/s/1Gt7F9pszGNX_pm_75YSO8w 提取码:9tp6 二
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:349184
    • 提供者:weixin_38586279
  1. Pandas数据处理学习笔记完整(待更)

  2. 这里写目录标题pandas文件读写1.1读取文本文件1.2 文本文件存储1.3 读取Excel文件1.4 Excel文件存储二 Series2.1 创建Series对象2.2 Series基本操作2.3 Series小结三 DataFrame3.1 DataFrame基本操作:3.2 numpy中的描述性统计函数3.3 Pandas中数值型特征的描述性统计方法3.4 DataFrame数据:类别型特征的描述性统计四 转换与处理时间序列数据4.1 转换字符串时间为标准时间 pandas文件读写 P
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:1048576
    • 提供者:weixin_38693476
  1. python处理excel表格数据

  2. python处理excel表格数据 方法一 你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。 excel表格数据筛选功能 方法二 利用编程语言(python) 使用第三方库pandas 处理数据是covid-19数据,数据时间从2020.1.22至2020.4.3,数据量大,有八九万条数据,如果只是手动提取,费时费力。采用编程代码的方式可以节省人力物力,仅需几秒即可搞定
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:314368
    • 提供者:weixin_38606656
  1. 【Tensorflow2.0】kaggle Titanic生死率预测

  2. 目录前言1-1,结构化数据建模流程范例一,准备数据二,定义模型三,训练模型四,评估模型五,使用模型六,保存模型 前言 kaggle Titanic生死率预测–0.81准确率–python超详细数据分析–附源代码和报告的下载地址 该文章升级版本,以前是用sklearn进行的预测(机器学习),现在用Tensorflow2.0(深度学习) 1-1,结构化数据建模流程范例 一,准备数据 titanic数据集的目标是根据乘客信息预测他们在Titanic号撞击冰山沉没后能否生存。 结构化数据一般会使用Pan
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:346112
    • 提供者:weixin_38690545
  1. Pandas中汇总统计、处理缺失值、层次化索引超详细介绍!(附实例)

  2. 阅读提示 本文将提到Pandas汇总统计和计算方法、处理缺失值操作、层次化索引等内容 目录阅读提示一、pandas汇总统计和计算1、sum()和cumsum()方法2、idxmax() 方法3、unique() 方法4、value_counts() 方法5、isin() 方法二、pandas处理缺失数据1、过滤缺失数据对于Series对于Dataframe2、对缺失值进行填充三、pandas层次化索引层次化索引1、根据索引选择数据子集2、重排分级顺序根据索引交换: swaplevel()根据索
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:110592
    • 提供者:weixin_38664427
  1. 利用pandas向一个csv文件追加写入数据的实现示例

  2. 我们越来越多的使用pandas进行数据处理,有时需要向一个已经存在的csv文件写入数据,传统的方法之前我也有些过,向txt,excel文件写入数据,传送门:Python将二维列表(list)的数据输出(TXT,Excel) pandas to_csv()只能在新文件写数据?当然不是! pandas to_csv() 是可以向已经存在的具有相同结构的csv文件增加dataframe数据。 df.to_csv('my_csv.csv', mode='a', header=False) to_cs
  3. 所属分类:其它

    • 发布日期:2020-12-20
    • 文件大小:30720
    • 提供者:weixin_38690017
  1. NumPy入门笔记(一)

  2. NumPy是Python的一个科学计算库,提供了矩阵计算的功能。Pandas对NumPy库进行了二次封装,提供了更强大的功能。 NumPy可用来存储和处理大型矩阵,比Python自身的数据结构(字符串,队列,元组,字典)更高级。NumPy的主要对象是一个多维度的,均匀的多维数组,可以进行矩阵运算。 1.创建矩阵 2.ndarray对象属性 3.矩阵的截取 创建矩阵 (1) 直接赋值创建矩阵 import numpy as np #创建一维数组 arr1=np.array([1,2,3,4,5])
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:51200
    • 提供者:weixin_38635166
  1. Python数据分析入门到实战.txt

  2. Python数据分析入门到实战;章节1:第一天:数据分析入门 章节2:第二天:Numpy数据处理库(1) 章节3:第三天:Numpy数据处理库(2) 章节4:第四天:Pandas库数据处理库(1) 章节5:第五天:Pandas数据处理库(2) 章节6:第六天:Pandas数据处理库(3) 章节7:第七天:Pandas数据处理库(4) 章节8:第八天:Pandas数据处理库(5) 章节9:第九天:Matplotlib绘图库(1) 章节10:第十天:Matplotlib绘图库(2) 章节11:第十一
  3. 所属分类:Python

  1. 鞍座:鞍座:Scala数据库-源码

  2. ===========================鞍座:Scala数据库 介绍 Saddle是Scala的数据处理库,它提供了数组支持的,索引的一维和二维数据结构,这些数据结构明智地专门针对JVM原语,以避免装箱和拆箱的开销。 Saddle提供矢量化的数值计算,沿索引的数据自动对齐,对丢失(N / A)值的鲁棒性以及I / O的便利性。 Saddle的灵感来自多个来源,其中包括R编程语言和统计环境,numpy和pandas Python库以及Scala集合库。 文献资料 执照 鞍座根据A
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:7340032
    • 提供者:weixin_42109178
  1. Pandas数据处理(二)

  2. 续上一篇,喜欢python的朋友请持续关注,共同成长 微信公众号“青少年思维训练营”,请关注! #切片处理 #pandas取行或者列的注意事项 #方括号中如果是字符串,取列 print(df[‘name’]) –out 0 小猫 1 小狗 2 小狼 #方括号中如果是数字,取行 print(df[:2]) #取第一行到第二行 –out Id name sex 0 001 小猫 女 1 002 小狗 男 #混合是取行列 #取第一行到第二行得’name’这一
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:32768
    • 提供者:weixin_38749268
  1. MachineLearning_Pratice:机器学习算法案例实战,python实现-源码

  2. 机器学习算法案例实战(python实现) 一。 1.加载数据 用熊猫加载 2.数据探索性分析及可视化 用matplotlib和seaborn对数据的标注(结果)进行。 3.特征处理 用pandas去除无关特征 用StandardScaler对数据进行标准化 4.模型训练 用train_test_split划分训练集和测试集 选择模型:SVM,决策树,随机森林,KNN 用GridSearchCV优化模型参数 用管道管道机制定制化分类器训练流程 5.模型评估 用对不同模型进行评估, 。 二。 1.
  3. 所属分类:其它

    • 发布日期:2021-03-29
    • 文件大小:2097152
    • 提供者:weixin_42106765