简单说明
这个算法主要工作是测量不同特征值之间的距离,有个这个距离,就可以进行分类了。
简称kNN。
已知:训练集,以及每个训练集的标签。
接下来:和训练集中的数据对比,计算最相似的k个距离。选择相似数据中最多的那个分类。作为新数据的分类。
python实例
复制代码 代码如下:# -*- coding: cp936 -*-
#win系统中应用cp936编码,linux中最好还是utf-8比较好。from numpy import *#引入科学计算包import operator #经典pyth