您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 菊安酱的机器学习第1期-k-近邻算法(直播).pdf

  2. k-近邻算法的课件。来自于菊安酱的机器学习实战12期的免费教程。内涵python源码。菊安酱的直播间: 我们已经知道k近邻算法的工作原理,根据特征比较,然后提取样本集中特征最相似数据(最近邻)的分类标签。 那么如何进行比较呢?比如表1中新出的电影,我们该如何判断他所属的电影类别呢?如图2所示。 电影分类 120 爱情片(1,101) 爱情片(12,97) 80 爱情片(5,89) 水弊 60 ?(24,67) 动作片(112,9 20 动作片(1158) 动作片(108,5) 0 20 60 8
  3. 所属分类:讲义

    • 发布日期:2019-07-27
    • 文件大小:867328
    • 提供者:qiu1440528444
  1. 用pandas划分数据集实现训练集和测试集

  2. 主要介绍了用pandas划分数据集实现训练集和测试集,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
  3. 所属分类:其它

    • 发布日期:2020-09-16
    • 文件大小:45056
    • 提供者:weixin_38739900
  1. 用pandas划分数据集实现训练集和测试集

  2. 1、使用model_select子模块中的train_test_split函数进行划分 数据:使用kaggle上Titanic数据集 划分方法:随机划分 # 导入pandas模块,sklearn中model_select模块 import pandas as pd from sklearn.model_select import train_test_split # 读取数据 data = pd.read_csv('.../titanic_dataset/train.csv') # 将特
  3. 所属分类:其它

    • 发布日期:2020-12-17
    • 文件大小:41984
    • 提供者:weixin_38523251
  1. Python数据分析神器——pandas(进阶教程)

  2. 文章目录合并数据集索引的合并轴向连接合并重叠数据重塑和轴向旋转重塑层次化索引将“长格式”旋转为“宽格式”数据转换移除重复数据利用函数或映射进行数据转换替换值重命名轴索引离散化和面元划分 合并数据集 pandas对象中的数据可以通过一些内置的方式进行合并: pandas.merge 可以根据一个或多个键将不同DataFrame中的行连接起来 pandas.concat 可以沿着一条轴将多个对象堆叠到一起 实例方法 combine_first 可以将重复数据连接在一起,用一个对象中的值填充另一个对
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:1002496
    • 提供者:weixin_38677306
  1. 利用python的mlxtend实现简单的集成分类器

  2. 实验环境 python 3.7.1+Anaconda 1.9.7+pycharm 2019.1 主要pkg pandas、numpy、sklearn、mlxtend 数据格式 Label: features: 主要实验步骤 数据读入 数据处理 数据集划分 stacking分类器定义 模型训练 准确度预测 具体过程 首先利用pandas的read_系列函数读入数据,我用的是read_excel,(很奇怪,不知道为什么用read_csv就会一直读入失败,,) 然后, 千万要注意,要处理好数据中的
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:164864
    • 提供者:weixin_38641366
  1. pandas-challenge-源码

  2. 熊猫挑战赛 Swift的 使用提供的虚构的免费视频游戏数据集,生成包含以下各项的报告: 玩家总数 采购分析(总计) 独特商品数 平均购买价 购买总数 总收入 性别人口统计 男性球员的百分比和数量 女选手的百分比和数量 其他/未披露的百分比和计数 采购分析(性别) 采购数量 平均购买价 购买总值 性别平均每人的平均购买总额 年龄人口统计下方各分为4年(例如<10、10-14、15-19等)的垃圾箱 采购数量 平均购买价 购买总值 按年龄段划分的人均购买总金额 最高支出者根据总购买价值确
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:89088
    • 提供者:weixin_42137032
  1. Health_Insurance_France:分析法国的医疗保健系统,以超过2018年的费用和医生密度为基础-源码

  2. 健康保险 分析法国的医疗保健系统,包括2018年超出的费用和医生的密度。 分析问题 在密度和医生超额费用之间建立联系; 趋势和相关性分析 数据采集​​: 从数据源中提取了两个数据集: 阿莫斯(保证马拉迪奥州政府令) 斯尼尔(全国系统) 数据集来源: 部门的劳动力和密度 按部门划分的卫生专业人员总费用 过程: 数据清理/整理,绘图,结果解释。 -方法:相关性,Catplot,Scatterplot,Barplot。 安装指南 pip install pandas pip install
  3. 所属分类:其它

    • 发布日期:2021-02-28
    • 文件大小:448512
    • 提供者:weixin_42181319
  1. python pandas cumsum求累计次数的用法

  2. 本文主要是针对 cumsum函数的一些用法。具体应用场景看下面的数据集。 第一列是userID,第二列是安装的时间,第三列是安装的次数。 我们现在想做一件事情。就是统计用户在某一天前累计的安装次数。 譬如,对userID为20的用户,问在16天前,其安装次数为多少? 答案应该是4次。用python的实现也很简单。 又譬如,userID为44在19天前安装的次数,那就应该是1+3+1+1=6次。 具体代码:(假设数据集为data) 由于是针对每个userID,所以是需要将userID划分一下(
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:48128
    • 提供者:weixin_38728360
  1. MachineLearning_Pratice:机器学习算法案例实战,python实现-源码

  2. 机器学习算法案例实战(python实现) 一。 1.加载数据 用熊猫加载 2.数据探索性分析及可视化 用matplotlib和seaborn对数据的标注(结果)进行。 3.特征处理 用pandas去除无关特征 用StandardScaler对数据进行标准化 4.模型训练 用train_test_split划分训练集和测试集 选择模型:SVM,决策树,随机森林,KNN 用GridSearchCV优化模型参数 用管道管道机制定制化分类器训练流程 5.模型评估 用对不同模型进行评估, 。 二。 1.
  3. 所属分类:其它

    • 发布日期:2021-03-29
    • 文件大小:2097152
    • 提供者:weixin_42106765