二、 感受质心的迁移过程

以上内容还是太抽象,但至少我们隐隐约约感受到,聚类算法最重要的三个要素是距离的计算方式、质心如何找到和[math]k[/math]k值的选择问题。目前来看,距离计算方式的选择问题不大,因为最常用的就是欧式距离和曼哈顿距离这两种,只要根据样本内容和研究目的进行适当选择就可以了。[br] 质心如何确定?它又是如何迁移的?对于这些问题,只有以用例的实际数据分步骤计算才能一睹真容。用例解析如下:[br] 某商业科技研究所对高原夏菜的农药残留进行了检测,提取样本数据134份,主要指标为三唑酮、三唑醇、多效唑的残留量,因为所采集样本的品类,来源地均不同,研究人员拟对样本主要指标先行进行聚类分析,期望在自然聚类中发现残留量与其他属性值之间的关系。[color=#0000ff][b][url=https://s21.ax1x.com/2025/02/03/pEZWNy4.png]图片及文件下载[/url][/b][/color]。[br][img]https://s21.ax1x.com/2025/02/03/pEZ2U9U.png[/img][br] 为了展现聚类算法的质心迁移过程,整个运算步骤在Excel表中进行迭代计算,可以清晰理解聚类算法的各个步骤,这里设[math]K=3[/math],距离计算采用欧式距离。质心变换过程见[color=#0000ff][b][url=https://www.geogebra.org/classic/npza3ybx]图2-3-1[/url][/b][/color]。

Information: 二、 感受质心的迁移过程