交叉验证()
1、观察模型稳定性的一种方法,避免测试集训练集划分导致模型不同
2、数据分为n份,依次把其中一份作为测试集,其他为训练集,交叉验证n次求平均值
3、model_selection.cross_val_score的五个参数
1)任何实例化的算法模型
2)不需划分测试集、训练集的特征矩阵
3)不需划分的完整标签
4)cv=10,做十次交叉验证,数据划分为十份,每次一份为测试集,剩下为训练集,通常选5,默认为5
5)scoring="neg_mean_squared_error",neg_mean_squared_error负均方误差。用这个指标评估交叉验证的结果。不填,回归默认返回R平方
1、回归问题处理的是连续型变量