机器学习概念.pdf介绍了机器学习中，监督学习、无监督学习、过拟合，以及采取相关的措施进行处理。6考

文件名称: 机器学习概念.pdf

所属分类: 机器学习

开发工具:

文件大小: 438kb

下载次数: 0

上传时间: 2019-07-26

提供者: qiu144*******

下载 (438kb)

不能下载？报告错误

详细说明：介绍了机器学习中，监督学习、无监督学习、过拟合，以及采取相关的措施进行处理。6考虑下面样本特征为二维欧式空间点的两分类问题的训练集,分别用最近邻法和三近邻法给出测试样本点(1,1)的类别 x0011122 1+ 2|+ 2 解:(1)计算距离 (x, y)Distance-(1, 1) (-1,1)Y(-1-12+(1-1)2)=2 (0,1)v(0-1)2+(1-1)^2)=1+ (02)(0-1y2+(2-1)^2)= (1,1)Y(1-1)2+(-1-1)^2)=2 (10)v(1-1)2+(-1)^2)=1+ (1,2)(1-1)42+(2-1)2)1+ (22)v(2-1)2+(2-1)2 23)v(2-1y2+(3-1)~2)=y5+ 最近邻法:0,1)+,(10)+,(1,2)+-->+ 三近邻法:(0,1)+,(1,0)+,(1,2)+--> 7用两个硬币玩抛硬币的游戏,硬币1得到正面的概率为θ,硬币2得到正面的概率为2θ,你一共拋了五次,得刭的结果是这样的(硬币1,正面)(硬币2,反面)(硬币2,反面)(硬币2,反面)(硬币2,正面),用极大似然法求参数0 解关键步骤 1.两个硬币的似然函数: P(x)~Ber(0)=I10-(1-0)1 P(x(0)~Ber(20)=I1(20)2(1-20)=a 2.根据观测得到的数据,似然函数为 P(x(,20)=0*(1-20)3*20=202(1-20)3,对数似然为 logP(x6,26)=2l0g0+3log(1-26)+log2,最大化对数似然,求导置零,得到”=吉 8有一个训练集,其样本为二维空间的点,正样本(1,1)、(-1,-1),负样本(1,-1)、(-1,1) 正鱼样本在原空间是否线性可分? (2)考虑一个特征变换X)=[1,X1,X2,X1X2].其中X1和X2为某样本X的两个坐标,在特征空间的预测函数为y(x)= WT=q(x),利用最大间隔方法求预测函数的参数W。(可以通过观察求解) (3)特征映射函数q(x)对应的核函数K(X,X)是什么样的? 解:(1)原问题是异或问题,正负样本线性不可分 (2)容易写出特征映射之后的样本点的值,正样本(1,1,1,1),(1,-1,-1,1),负样本(1, 1,-1,-1),(1,-1,1,-1),观察易得w取(0,0,0,1)最大间隔为2 (3)K(x,x2)=c(x),q(x)>=K(xx)=<中(x),(x)=x_1x14+x2x24+〖x1x2x〗_zx24+1 9.简述EM算法;论述其为什么收敛;用EM求解混合高斯模型时,在E步和M步分别做什么? 解:当存在未观测数据或缺失数据时,可以引入隐变量,这时对不完全数据直接进行极大似然求解往往比较困难。 EM算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值(分布),计算完全数据og似然的期望:第二步是最大化(M),最大化在E步上求得的完全数据g似然的期望来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交进行在E步,把q(2置为当前参数下所估计的隐变量的分布,从而这使得不完全数据g似然的下界在这个参数上最大化并等于不完全数据g似然;在M步,固定隐变量的分布,最大化og似然的下界来重新求参数,这等价于最大化在E步求得的隐变量分布下全数据g似然的期望。田于算法保证了每次送代之后,似然函数都会增加,所以函数最终会收敛用EM算法求解GMM时,在E步,求当前参数下,每个样本由每个高斯产生的概率;在M步,根据上述概本重新计算 GMM的参数。

(系统自动生成,下载前可以参看下载内容)