文件名称:
房屋价格预测-阿姆斯:试图做套索+多项式特征-源码
开发工具:
文件大小: 33mb
下载次数: 0
上传时间: 2021-02-25
详细说明:房屋价格预测
学分: :
概括:
数据读取和EDA我已读取数据并执行了基本的EDA以获得洞察力。 已检查重复的行。所有预测变量与目标变量的散点图将显示线性/非线性的存在。 热图显示没有目标变量的最相关的特征。 我们检查这些变量以及目标变量中是否存在偏斜。 稍后我们将对它们应用log和boxcox转换。
数据清理我参考了以下有关特征工程的资源已根据文档删除了异常值,但保留了大多数异常值以最大程度地减少数据丢失。 再次在文档之后,缺失值已被替换为单独的类别或被替换为零。 目标变量是对数转换的。
特征工程这是最关键的一步,因为我从现有特征中获得了更多有用的特征,这些特征将改进我们的模型。 找到倾斜的列,然后应用boxcox转换。 此外,通过标签编码为某些编码为数值的分类特征提供了一般性。 这将帮助模型有效学习。 通过创建二进制列,我们将从缺少的值中获取更多信息,这些值被编码为单独的类
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.