GBDT 和 决策森林 的区别?
(1)随机森林采用的bagging思想,而GBDT采用的boosting思想。这两种方法都是Bootstrap思想的应用,Bootstrap是一种有放回的抽样方法思想。虽然都是有放回的抽样,但二者的区别在于:随机森林是通过减少模型方差提高性能;GBDT是通过减少模型偏差提高性能。Bagging的训练集的选择是随机的,各训练集之间相互独立,弱分类器可并行,而Boosting的训练集的选择与前一轮的学习结果有关,是串行的。 (2)组成随机森林的树可以是分类树,也可以是回归树;而GBDT只能由回归树组成。 (3)组成随机森林的树可以并行生成;而GBDT只能是串行生成。 (4)随机森林对异常值不敏感;GBDT对异常值非常敏感。