四、目标权重参数(用的少)
控制目标权重,保持样本标签平衡(不平衡:某类标签占比大,决策树会向占比大标签偏移)
1、class_weight
1)给少量标签更多权重,参数默认None(所有标签相同权重)
2、min_weight_fraction_leaf
1)基于权重的剪枝参数,比min_samples_leaf更偏向主导类
2)样本加权使用此参数剪枝
重要接口
1、fit训练,score
2、apply测试样本叶子节点索引,predict返回测试样本分类或回归标签结果(只输入训练集特征,不需要标签y)
注:所有接口中要求输入x_test或x_train部分必须输入二维矩阵,不接受任何一维矩阵输入,若数据只有一个样本,reshape(-1,1)增维