您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Phase3_Project-源码

  2. Phase3_Project 欢迎来到我的第3阶段项目:分类器。 在这里,我的任务是查找自己的数据并解决自己的问题。 我从网站上选择了一个威士忌数据库: : 这满足了可接受的数据库的要求,因此我立即决定要创建一个模型来成功预测瓶子是否昂贵。 幸运的是,在进入建模之前,数据不需要太多的预处理,除了一件事情:数据中的许多威士忌名称还包含年龄(例如:“ Ardbeg 10yo”),因此采用它似乎是一个好主意这些名称,使模型成为另一个标准。 这花了一些时间来解析数据中所有威士忌的名称,拉出年龄
  3. 所属分类:其它

    • 发布日期:2021-03-26
    • 文件大小:492544
    • 提供者:weixin_42134117
  1. Phase3_Project:坦桑尼亚水井竞赛-源码

  2. Phase3_Project 推动数据竞争>抽水:数据挖掘地下水位坦桑尼亚水井比赛 任务 根据提供的数据,预测哪些井处于“功能性”,“需要维修”或“非功能性” 打扫: 有很多类似的列-要删除的选定列。 根据位置描述数据推算缺少的物理地理数据将缺少的分类功能设置为“未知” 要素工程-将日期记录为一年中的某天和几年中的工作 造型 跑许多模型与: 不同的超参数 有/没有标准标量 删除不同数量的不频繁类别或目标编码 结论 最佳模型:CatBoost,对测试集的预测精度为81% -准确性是比赛
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:15728640
    • 提供者:weixin_42125192