一、算法概述

[br] KNN 算法的原理就是当预测一个新值 x 属于哪个类别时,根据它距离最近的 K 个点的类别属性的占比大小来进行简单分类。从这个意义上讲,K 值的选取是本算法的关键,不同的 K 值会带来类别属性占比大小的变化,从而影响 x 的分类判别。以图 2-4-1所示的图形进行说明。[br][table][tr][td][img]https://s21.ax1x.com/2025/02/12/pEu97lV.png[/img][/td][td][img]https://s21.ax1x.com/2025/02/12/pEu9HyT.png[/img][/td][/tr][/table] 图 2-4-1 KNN 算法原理图示[br][br] 图 2-4-1 中圆点和叉点分别代表两个类,菱形点是被分类点,如果取[math]k=3[/math] ,则其近邻共3 个点,2 叉点 1 圆点,所以被归类为叉类;如果取[math]k=5[/math],则其近邻共 5 个点,3 圆点 2 叉点,则其又被归类为圆类。[math]k=1,2,3,4,5[/math]时的动态图显示如下:
由此,可以归纳出 KNN 算法流程,如图 2-4-2 所示。
[size=100] 图 2-4-2 KNN 算法流程[/size]

Information: 一、算法概述