您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 二手车交易价格预测学习笔记 — Task3

  2. 赛题:零基础入门数据挖掘 – 二手车交易价格预测 地址:https://tianchi.aliyun.com/competition/entrance/231784/introduction?spm=5176.12281957.1004.1.38b02448ausjSX 特征工程 常用方法 from operator import itemgetter 获取某位置的数据 pandas 提取行数据 pd.iloc() 或 pd.loc() 分位数 quantile() pandas 一维数组 pd
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:62464
    • 提供者:weixin_38721252
  1. Datawhale从零开始数据挖掘第三次打卡

  2. Task3特征工程 Review 在上一阶段的学习,我们分析了数据,下面大概总结一下在特征工程中要用到的结论: seller和offertype对预测基本没用,需要删掉 特征v_1和v_6基本线性相关,保留一个就可以 数字特征为 [‘power’, ‘kilometer’, ‘v_0’, ‘v_1’, ‘v_2’, ‘v_3’, ‘v_4’, ‘v_5’, ‘v_6’, ‘v_7’, ‘v_8’, ‘v_9’, ‘v_10’, ‘v_11’, ‘v_12’, ‘v_13’,‘v_14’ ] 类别
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:215040
    • 提供者:weixin_38595473
  1. aliyun-tianchi-datamining-heartbeatclassification:数据挖掘-心跳信号分类-源码

  2. 阿里云天池数据挖掘心跳分类 数据挖掘-心跳信号分类 Task1赛题理解及baseline学习2天 完成基础上的方案,并成功运行提交结果。 Task2探索性数据分析(EDA)(3天) EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得的数据集可以用于接下来的机器学习或深度学习使用。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。的探索性分析,并对于数据进行一些图表或文字总结并打卡。 Task3特征工程3天 对于特征工程的分
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:22528
    • 提供者:weixin_42100129
  1. Task3 特征工程

  2. Task3 特征工程 一、数据预处理 在这一块,比较常用的包是sklearn.Processing data,主要包括以下操作: 异常值处理 使用箱型图(或小提琴图)发现离群点(off-group points)之后,为了不干扰实验结果,我们通常将离群点处理掉: #from DW阿泽 import the code def outliers_proc(data, col_name, scale=3): 用于清洗异常值,默认用 box_plot(scale=3)进行清洗 :pa
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:544768
    • 提供者:weixin_38626179
  1. 零基础入门数据挖掘-Task3 特征工程

  2. 目录 1. 学习内容 2. 导入相关模块和数据 3. 判别异常值 3.1 什么是异常值 3.2 常见的异常值判别方法 3.2.1 简单统计分析 3.2.2 3σ原则 3.2.3 箱型图 3.3 异常值处理方法 3.4 异常值处理实现(箱型图+删除异常值) 4. 构造新特征并保存数据到文件 4.1 供树模型使用 4.1.1 合并训练集和测试集 4.1.2 新建“使用时间”特征 4.1.3 新建“城市信息”特征 4.1.4 新建“统计信息”特征(以品牌为例) 4.1.5 数据分桶(以马力为例) 4.
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:220160
    • 提供者:weixin_38658568