K-Means可能是最知名的聚类算法,没有之一。在很多介绍性的数据科学和机器学习课程中,都有讲授该算法。并且该算法的代码很容易理解和实现!你可以通过看下面的插图来理解它。K均值聚类1、首先,我们选择一些要使用的类/组,并随机初始化他们各自的中心点(质心)。要计算出簇(类)的使用数量,最好的方法是快速查看一下数据并尝试鉴别有多少不同的分组。中心点是一个矢量,它到每个数据点的矢量长度相同,在上图中用“X”来表示。2、每个数据点通过计算该点与每个簇中心之间的距离来进行分类,根据最小距离,将该点分类到对