开发工具:
文件大小: 247kb
下载次数: 0
上传时间: 2021-03-15
详细说明:699最终项目
您好,我叫Matthew Hui,我是旧金山大学目前在读数据科学的硕士研究生。 该存储库适用于我的机器学习实验室课程,我们在其中探讨了scikit-learn的各种功能以及如何在数据科学生命周期中使用它。
您可以在找到的链接
您可以在找到指向我的代码的链接,也可以从存储库中下载它。
数据
该数据集包含有关报名参加公司数据科学课程的各种候选人的信息。 该公司正试图找出这些候选人中的哪些人选修了学习新技能的课程,而哪些人正在寻找新的工作。 数据集包含约19,000行和14列。
特征工程
数据集包含缺失值,因此我使用了一个简单的脉冲(连续变量的估计中位数,离散变量的估计中位数为“未知”)。 我还对数据使用了序数编码和一种热编码。
演算法
我使用随机搜索执行了超参数搜索。 我尝试调整的超参数是:
判据:这两个判据是两个不同的函数,这些函数确定拆分的好坏。
最大深度:限制每棵树
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.