[size=100][b] (1)写出 K 近邻(K Nearest Neighbor)算法的流程。[/b][/size]
[size=100] [b](2)简述KNN算法的特点。[/b][/size]
[b] (3) KNN(K Nearest Neighbors)操作实践。[/b][br] [br] ① 作业目的。[br] a. 理解距离 K 个训练样本最近的距离是如何计算的。[br] b. 掌握 K 的正确取值方法。[br][br] ② 作业准备。[br] [b][color=#0000ff] [url=https://orangedatamining.com/download/]Orange3 软件[/url][icon]/images/ggb/toolbar/mode_zoomin.png[/icon][/color][/b]下载并安装。[br] 通过计算对象间距来作为各个对象之间的非相似性指标,距离一般使用欧式距离或曼哈顿距离。其计算方法为[br][br] 欧式距离:[math]d\left(x,y\right)=\sqrt{\sum^n_{k=1}\left(x_k-y_k\right)^2}[/math] [br][br] 曼哈顿距离:[math]d\left(x,y\right)=\sqrt{\sum^n_{k=1}|x_k}-y_k|[/math][br][br] ③ 作业内容。[br] a. 计算已知类别数据集中的点与当前点之间的距离。[br] b. 按照距离递增次序排列。[br] c. 选取与当前点距离最小的 K个点。[br] d. 确定前 K 个点所在类别出现的频率。[br][br] Ⅰ. KNN 的交叉验证。[br] 按 The Validation Set Approach 方法取 K 值,并将各 K 值错误率写入报告。[br] 按 Cross-Validation 方法取 K 值,并将各 K 值错误率写入报告。[br] [br] Ⅱ. KNN 模型评估指标。[br] 按图 2-4-7 和图 2-4-8 生成模型评估数据。[br] Ⅲ. 撰写数据测试报告。[br][br][br][br][br]