随机森林>>>分类器比较好用吗?
random_state是不同的特征作为初始的节点来产生的不同的树,所以需要不同的特征
袋装法,有放回的随机抽样技术
n个样本组成的自助集
bootstrap>>默认为True
袋外数据(out of bag data,简写为oob)
随机森林>>>分类器比较好用吗?
random_state是不同的特征作为初始的节点来产生的不同的树,所以需要不同的特征
袋装法,有放回的随机抽样技术
n个样本组成的自助集
bootstrap>>默认为True
袋外数据(out of bag data,简写为oob)
criterion 不纯度的衡量指标
有基尼系数和信息熵,信息熵的增益
n_estimators 这是森林中树木的数量,基评估器的数量,default-10
实例化-交叉验证
波动本质上是一样的, 但集成算法压倒性的强
集成算法
调参曲线,交叉验证,网格算法 调参方法
base estimator 基评估器
boosting 结合弱评估器一次次对难以评估的对象进行攻克
对特征提问得出决策规则-决策树
# 函数rotation=90旋转的度数
###调整x或者y轴上的参数
1.from matplotlib import pyplot as plt引入函数
2.plt.figure(figsize=(20,8),dpi=80)
#figurezide图片大小,(长,宽),dpi越大越不容易失真
from matplotlib import pyplot as plt x=range(2,26,2) y=[15,13,14,5,17,20,25,26,26,27,22,18,15] #设置图片大小 #figurezide图片大小,(长,宽),dpi越大越不容易失真 plt.figure(figside=(20,8),dpi=80) #绘图 plt.plot(x,y) #设置x轴 _xtick_labels=[i/2 for i in range(2,49)] plt.xticks(_xtick_labels[::3]) #保存 #plt.savefig("./t1.png") #展示 plt.show()
ctrl+/ 注释快捷键 等于#
特殊注释:
#!/usr/bin/python3 linux
# --coding=utf-8 -- python2 only
try:
可能会报错的代码块
except:
报错之后执行的代码块
eles:
没有报错的代码块
finally:
不管有没有出错都执行的代码块
__new__和单例对象
使用私有属性的场景
1.把特定的一个属性隐藏起来,不想让类的外部进行直接调用。
2.想要保护这个属性,不想让属性的值随意的改变
3.保护这个属性,不想让派生类(子类)去继承
1.类对象所拥有的方法,需要@startimcemethod 来表示静态方法
2.静态方法不需要参数。
3.静态方法主要用来存放逻辑性的代码,本身和类以及实例对象没有交互,也就是说,在静态方法中,不会涉及到类中方法和属性的操作。
在Python中,有一些内置好的特定的方法,方法是“——xxx——”,在进行特定的操作地会自动调用,这些方法被称为魔术方法。
1.self特点:self只有在类中定义实例方法的时候才有意义,在调用时候不必传入相应的参数,而是有解释器自动去指向
2.self的名字是可以更改的,可以定义成其他的名字,只是,约定俗成了self
3.self指的是类实例对象本身,相当于Java中this
__init__
1.Python自带的内置函数,具有特殊的函数,使用双下划线包起来的【魔术方法】
2.是一个初始化的方法用来定义实例属性和初始化数据的,在创建对象时自动调用,不用手动去调用
3.利用传参的机制让饿哦们定义功能更加强大并且方便的类
https://docs.python.org/3/library/functions.html
degree:默认为2,输入的整数越大,升入的维度越高
ordinal:会返回一列特征
什么是正则化路径?
不同a对应的特征向量的参数的取值所对应的矩阵
eps, n_alphas作用?帮助生成很小的a的取值
岭回归和LASSO的评估指标?岭回归是R2,LASSO是MSE
参数alpha_和alphas_?最佳a、自动生成的a
岭回归和LASSO计算交叉验证结果的区别?
ridge.cv_values_.mean(axis=0)#跨行求均值
lasso.mse_path_.mean(axis=1)#跨列求均值
为什么要用LASSO特征选择?LASSO对alpha敏感
如何画一条水平的虚线?