开发工具:
文件大小: 438kb
下载次数: 0
上传时间: 2019-07-26
详细说明:介绍了机器学习中,监督学习、无监督学习、过拟合,以及采取相关的措施进行处理。6考虑下面样本特征为二维欧式空间点的两分类问题的训练集,分别用最近邻法和三近邻法给出测试样本点(1,1)的
类别
x0011122
1+
2|+
2
解:(1)计算距离
(x, y)Distance-(1, 1)
(-1,1)Y(-1-12+(1-1)2)=2
(0,1)v(0-1)2+(1-1)^2)=1+
(02)(0-1y2+(2-1)^2)=
(1,1)Y(1-1)2+(-1-1)^2)=2
(10)v(1-1)2+(-1)^2)=1+
(1,2)(1-1)42+(2-1)2)1+
(22)v(2-1)2+(2-1)2
23)v(2-1y2+(3-1)~2)=y5+
最近邻法:0,1)+,(10)+,(1,2)+-->+
三近邻法:(0,1)+,(1,0)+,(1,2)+-->
7用两个硬币玩抛硬币的游戏,硬币1得到正面的概率为θ,硬币2得到正面的概率为2θ,你一共拋了五次,得刭的结
果是这样的(硬币1,正面)(硬币2,反面)(硬币2,反面)(硬币2,反面)(硬币2,正面),用极大似然法求
参数0
解
关键步骤
1.两个硬币的似然函数:
P(x)~Ber(0)=I10-(1-0)1
P(x(0)~Ber(20)=I1(20)2(1-20)=a
2.根据观测得到的数据,似然函数为
P(x(,20)=0*(1-20)3*20=202(1-20)3,对数似然为
logP(x6,26)=2l0g0+3log(1-26)+log2,最大化对数似
然,求导置零,得到”=吉
8有一个训练集,其样本为二维空间的点,正样本(1,1)、(-1,-1),负样本(1,-1)、(-1,1)
正鱼样本在原空间是否线性可分?
(2)考虑一个特征变换X)=[1,X1,X2,X1X2].其中X1和X2为某样本X的两个坐标,在特征空间的预测函数为y(x)=
WT=q(x),利用最大间隔方法求预测函数的参数W。(可以通过观察求解)
(3)特征映射函数q(x)对应的核函数K(X,X)是什么样的?
解:(1)原问题是异或问题,正负样本线性不可分
(2)容易写出特征映射之后的样本点的值,正样本(1,1,1,1),(1,-1,-1,1),负样本(1,
1,-1,-1),(1,-1,1,-1),观察易得w取(0,0,0,1)最大间隔为2
(3)K(x,x2)=c(x),q(x)>=K(xx)=<中(x),(x)=x_1x14+x2x24+〖x1x2x〗_zx24+1
9.简述EM算法;论述其为什么收敛;用EM求解混合高斯模型时,在E步和M步分别做什么?
解:当存在未观测数据或缺失数据时,可以引入隐变量,这时对不完全数据直接进行极大似然求解往往比较困难。
EM算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值(分布),计算完全
数据og似然的期望:第二步是最大化(M),最大化在E步上求得的完全数据g似然的期望来计算参数的值。M步
上找到的参数估计值被用于下一个E步计算中,这个过程不断交进行
在E步,把q(2置为当前参数下所估计的隐变量的分布,从而这使得不完全数据g似然的下界在这个参数上最大化并
等于不完全数据g似然;在M步,固定隐变量的分布,最大化og似然的下界来重新求参数,这等价于最大化在E步
求得的隐变量分布下全数据g似然的期望。田于算法保证了每次送代之后,似然函数都会增加,所以函数最终会收
敛
用EM算法求解GMM时,在E步,求当前参数下,每个样本由每个高斯产生的概率;在M步,根据上述概本重新计算
GMM的参数。
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.