机器学习-Sklearn（第三版） - 拜师教育 - 师徒制教育平台|人工智能培训|大数据培训|JAVA培训|PYTHON培训|

748人加入学习

(0人评价)

机器学习-Sklearn（第三版）

价格免费

教学计划

学习有效期 365 天（随到随学）

扫一扫扫二维码继续学习二维码时效为半小时
分享
已收藏
收藏

该课程属于 1515-小刀-算法方向-金融风控-就业：是请加入后再学习

排序：最新笔记
- 最新笔记
- 点赞最多

随机森林>>>分类器比较好用吗?

random_state是不同的特征作为初始的节点来产生的不同的树,所以需要不同的特征

袋装法,有放回的随机抽样技术

n个样本组成的自助集

bootstrap>>默认为True

袋外数据(out of bag data,简写为oob)

[展开全文]

3234陈一苇 · 2022-08-31 · 019 - 2 2.2 参数boostrap & oob_score + 重要属性和接口.mp4 0

2、random_state

1）随机森林中的random_state控制的是生成森林的模式，设成固定值生成一组固定的树

2）决策树中的random_state控制随机选择特征分支

3）随机性越大，bagging效果一般越好，因此一般不设置，若追求稳定性可设置成固定值

3、bootstrap、oob_score

1）bootstrap默认为True，控制有放回的随机抽样

2）oob_score默认为False，设置为True表示希望用袋外数据测试模型，此时训练函数中放入完整数据（不用划分训练集、测试集）

三、重要属性

1、estimators_，查看森林中树的状况

.estimators[num]取出一棵树

2、oob_score_，查看在袋外数据上测试结果

3、feature_importance_查看特征重要性（用zip把特征重要性和特征名连起来，易于观察哪一个特征更为重要）

四、重要接口

1、4个常用接口：apply（返回测试集中每一个样本在每一棵树中叶子节点的索引；需要画图或需要提取单独叶子节点时使用）、fit、predict（返回对测试集预测的标签）、score

2、predict_proba：

1）返回每个测试样本被分到每一类标签的概率，标签几类，返回几个

[展开全文]

3077_Yuki · 2022-07-04 · 019 - 2 2.2 参数boostrap & oob_score + 重要属性和接口.mp4 0

随机森林的本质是一种装袋集成算法（bagging），装袋集成算法是对基评估器的预测结果进行平均或用多数表决原则来决定集成评估器的结果。在刚才的红酒例子中，我们建立了25棵树，对任何一个样本而言，平均或多数表决原则下，当且仅当有13棵以上的树判断错误的时候，随机森林才会判断错误。单独一棵决策树对红酒数据集的分类准确率在0.85上下浮动，假设一棵树判断错误的可能性为0.2(ε)。所以，当一共有25棵树时，判断错误的可能性为：