文件名称:
大数据程序:使用Spark和R编程语言的大数据程序-源码
开发工具:
文件大小: 186mb
下载次数: 0
上传时间: 2021-02-13
详细说明:大数据程序
使用Spark MLlib和ML库以及R编程语言的大数据程序
R编程
回归:我们考虑了特征/预测变量仅线性出现在模型中的情况。 对于Credit数据集,与常规线性模型相比,岭回归和套索仅做了很小的改进。 我们可以添加到模型中的最简单的非线性类型是特征的成对相互作用。 如果xj和xk是不同的特征,则意味着我们也将xjxk视为特征。 在R中,成对交互非常容易实现:X = model.matrix(balance〜。*。,Credit)[,-1](1)成为新的设计矩阵。 那个工程 。 ∗。 意味着考虑不同特征的所有成对乘法。
广义加性模型:我们查看了Credit数据集,将注意力集中在收入,限额和学生这一要素上,以作为平衡的预测指标。在此问题中,我们将在分析中将年龄替换为限额。 具体来说,像以前一样包括学生,并以具有4个自由度的自然样条合并收入的影响。 使用自然样条线还可以考虑年龄的
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.