邻近算法,或者说是K最邻近算法,是一个相对简单的多分类算法,其基本工作原理为:
首先我们存在一个训练集,训练集中的每个图片都存在标签(已知图片属于哪一类).对于我们输入的没有标签的数据,我们将新数据中的每个特征与样本集合中的数据的对应特征进行比较,计算出二者之间的距离,然后记录下与新数据距离最近的K个样本,最后选择K个数据当中类别最多的那一类作为新数据的类别。
下面通过一个简单的例子说明一下:如下图,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于红色三角形所占比例为2/3