说明:主要的方法就是,将数据存储在kd树这种空间数据结构中,树的思想类似于二叉搜索树、红黑树等,真的很强大(相信童靴们明白的)。改进的k-means方法主要考虑了合理的初始候选质心的方式,并且利用kd树的特性,减少了循环计算欧式距离的次数,并且从Voronoi多边形得到的启发进行最近点计算和剪枝策略,实现的代码。运行证明在大量数据的情况下,算法的执行效率确实有很大改进。最后感谢Tapas Kanungo等的论文《An Efficient k-Means Clustering Algorithm:Ana
<qq_42395033> 在 上传 | 大小:96256