您当前的位置: 首页 >  ar

IT之一小佬

暂无认证

  • 0浏览

    0关注

    1192博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

决策树算法之cart剪枝

IT之一小佬 发布时间:2021-04-07 21:57:39 ,浏览量:0

决策树算法之cart剪枝 1 为什么要剪枝      【决策树容易发生过拟合】

•横轴表示在决策树创建过程中树的结点总数,纵轴表示决策树的预测精度。

•实线显示的是决策树在训练集上的精度,虚线显示的则是在一个独立的测试集上测量出来的精度。

•随着树的增长,在训练样集上的精度是单调上升的, 然而在独立的测试样例上测出的精度先上升后下降。

出现这种情况的原因:

•原因1:噪声、样本冲突,即错误的样本数据。

•原因2:特征即属性不能完全作为分类标准。

•原因3:巧合的规律性,数据量不够大。

2 常用的减枝方法 2.1 预剪枝

(1)每一个结点所包含的最小样本数目,例如10,则该结点总样本数小于10时,则不再分;

(2)指定树的高度或者深度,例如树的最大深度为4;

(3)指定结点的熵小于某个值,不再划分。随着树的增长, 在训练样集上的精度是单调上升的, 然而在独立的测试样例上测出的精度先上升后下降。

2.2 后剪枝:     【把一棵树构建完后,再进行从下往上剪枝】

后剪枝,在已生成过拟合决策树上进行剪枝,可以得到简化版的剪枝决策树。

关注
打赏
1665675218
查看更多评论
立即登录/注册

微信扫码登录

0.0383s