第三节 算法用例

以天气打球数据集[math]D[/math]为例,在[math]Orange[/math]中用决策树算法构造的流程图(图3-4)如下:[img]https://www.freeimg.cn/i/2024/02/05/65c0ea781e21e.png[/img][br][center]图3-4 Orange中决策树构造流程图[/center]
打开[i]Tree[/i]的窗口,如下图(图3-5)。[br][center][img]https://www.freeimg.cn/i/2024/02/05/65c0eb40f128f.png[/img][br]图3-5 Orange中[i]Tree[/i]参数窗口[/center]
里面有几个重要的指标:[br][i] Induce binary tree[/i] 创建一个二叉树;[br][i] Min. number of instances in leaves[/i] 每个节点最小实例限制;[br][i] Do not split subsets smaller than[/i] 子集实例小于x的时候不再进行拆分;[br][i] Limit the maximal tree depth to [/i]树的最大深度不深于x[br] 对于分类:[br][i] Stop when majority reaches [%] [/i]当纯度大于x时不再进行拆分;[br] 通过Tree模型插件后数据就分好类了,然后我们再使用Tree viewer可视化插件看下分类情况,如下图(图3-6)。可以看到Tree viewer很形象地展示了决策树,与我们的手动计算结果一致,也表示出了每个特征分类值。[br][center][img]https://www.freeimg.cn/i/2024/02/05/65c0ebb2e5927.png[/img][/center][center]图3-6 Orange中Tree viewer决策树[br][br][/center] 以上所有内容均在百度网盘提供下载,网址为:[br] [url=https://pan.baidu.com/disk/main?from=oldversion#/index?category=all&path=%2F%E9%85%8D%E5%A5%97%E8%B5%84%E6%BA%90%E4%B8%8B%E8%BD%BD%2FDecision%20Tree][u]https://pan.baidu.com/disk/main?from=oldversion#/index?category=all&path=%2F%E9%85%8D%E5%A5%97%E8%B5%84%E6%BA%90%E4%B8%8B%E8%BD%BD%2FDecision%20Tree[/u][/url]。[br] 

Information: 第三节 算法用例