解锁式学习
749人加入学习
(0人评价)
机器学习-Sklearn(第三版)
价格 免费
承诺服务
该课程属于 2243-咸鱼-算法方向-数据挖掘-就业:否 请加入后再学习

机器学习调参基本思想

调参目标是提升某个模型评估指标

1、泛化误差(衡量模型在未知数据上准确率的指标)

1)在测试集上表现不好:泛化能力不够

2)泛化误差受模型结构(复杂度)影响(U型曲线),调参之前,判断模型在曲线哪个部分

3)模型太简单或太复杂,泛化误差都会升高,追求的是中间的平衡点

4)模型太复杂:过拟合,太简单:欠拟合

5)树模型和树的集成模型,越深、枝叶越多、模型越复杂

6)树模型和树的集成模型目标:减少模型复杂度(剪枝),使模型向图像左边移动

2、各个参数对树模型的影响程度(由大到小)

1)n_estimators:计算量允许,越大越好,不影响单个模型复杂度

2)max_depth:默认让树生长到最茂盛,下降,模型更简单

3)min_samples_leaf、min_samples_split:默认最小限制1、2,即最高复杂度,调大,模型更简单

4)max_features:默认特征总数开平方(auto),中间复杂度,减小,更简单,增加,更复杂(不怎么用)

5)criterion:一般选gini(影响看具体情况)

 

 

[展开全文]

用来衡量模型在未知数据上的准确率的指标,叫做泛化误差(Genelization error)

泛化误差:

当模型在未知数据(测试集或者袋外数据)上表现糟糕时,我们说模型的泛化程度不够,泛化误差大,模型的效果 不好。泛化误差受到模型的结构(复杂度)影响。看下面这张图,它准确地描绘了泛化误差与模型复杂度的关系, 当模型太复杂,模型就会过拟合,泛化能力就不够,所以泛化误差大。当模型太简单,模型就会欠拟合,拟合能力 就不够,所以误差也会大。只有当模型的复杂度刚刚好的才能够达到泛化误差最小的目标。

1)模型太复杂或者太简单,都会让泛化误差高,我们追求的是位于中间的平衡点

2)模型太复杂就会过拟合,模型太简单就会欠拟合

3)对树模型和树的集成模型来说,树的深度越深,枝叶越多,模型越复杂

4)树模型和树的集成模型的目标,都是减少模型复杂度,把模型往图像的左边移动

 

[展开全文]