4、max_features
1)限制分枝考虑的特征个数
2)用于高维数据,防止过拟合
3)缺点:强行设定会导致模型学习不足。
4)如果希望通过降维防止过拟合,最好使用PCA,ICA中的降维算法
5、min_impurity_decrease
1)限制信息增益的大小,信息增益小于指定数值的分枝不会发生
2)信息增益:父节点和子节点信息熵的差(子节点信息熵一定小于父节点信息熵),越大,这一层分枝对决策树贡献越大
注:
1)如何确定最优的剪枝参数?画出超参数学习曲线
2)剪枝参数不一定能提升模型在测试集上的表现