数据标准化,把它变成标准分布。
数据标准化,把它变成标准分布。
很不错的例子,肺癌
Step 2:预处理
Step 1:创建自定义数据集
w = torch.rand(16, 3, 5, 5)
= (ker_num, input_channel, ker_size, ker_size)
Input_channels:
Stocastic: 随即筛选样本
val_set: for detecting overfitting
torch.nn.function
.matmul() 取后两维相乘
unsqueeze:
正:在之前插入
负:在之后插入
.index_select(0, [0, 2])
torch.tensor([2., 3.2])
torch.FloatTensor(2, 3)
Unintialized: 未初始化的tensor
增强学习一般用 DoubleTensor
几何概率:与构成事件的长、面积、体积 成比例;
几何概率特点:基本事件 的无限性(抽象)、等可能性;
古典概型特点:基本事件 的有限性(具象)、等可能性;
同时调整多个参数,模型运行非常慢。更换数据预处理的方式。
调参可以画学习曲线,或者进行网格搜索。模型调参,第一步找目标。
泛化误差:当模型在未知数据表现很差时,表明模型泛化能力不够。模型太简单和太复杂泛化误差都会很大。
偏差-方差困境。n_estimator增加,不影响单个模型的复杂度。调参方向:降低模型复杂度。
max_deph有增无减,模型复杂度增加。
当复杂度无法再降低时,就可以不用再tiaozhnegle
[*矩阵]查看列的索引。需要Ytest所带的索引,
使用随机森林填补缺失值。n个数据,特征T有缺失值,把特征T当作标签,作为训练集。遍历所有特征,缺失值最少的特征进行填补,因为一开始需要的缺失值最少。当进行到最后一行时,那么在弥补缺失值最多的数据时,就有足够多的准确数据了。
随机森林填补获取数据集时的缺失值。
sklearn.impute.SimpleImputer轻松填补数据缺失值。