其他
【机器学习】一个完整的K-means聚类算法指南!
本文约2700字,建议阅读5分钟
如果你不想被引导到错误的结果,你需要了解它的假设和它的运作方式。K个质心是随机创建的(基于预定义的K值) K-means将数据集中的每个数据点分配到最近的质心(最小化它们之间的欧几里德距离),这意味着如果数据点比任何其他质心更接近该群集的质心,则认为该数据点位于特定集群中。 然后K-means通过获取分配给该质心集群的所有数据点的平均值来重新计算质心,从而减少与前一步骤相关的集群内总方差。K均值中的“均值”是指对数据求均值并找到新的质心。 该算法在步骤2和3之间迭代,直到满足一些标准(例如最小化数据点与其对应质心的距离之和,达到最大迭代次数,质心值不变或数据点没有变化集群)
编辑:文婧