机器学习-Sklearn（第三版） - 拜师教育 - 师徒制教育平台|人工智能培训|大数据培训|JAVA培训|PYTHON培训|

748人加入学习

(0人评价)

机器学习-Sklearn（第三版）

价格免费

教学计划

学习有效期 365 天（随到随学）

扫一扫扫二维码继续学习二维码时效为半小时
分享
已收藏
收藏

该课程属于 1515-小刀-算法方向-金融风控-就业：是请加入后再学习

排序：最新笔记
- 最新笔记
- 点赞最多

重要参数C

权衡”训练样本正确分类“和”决策函数边际最大化“（边际更宽的决策边际更好）

浮点数，默认为1，必须大于等于0

调参：一般从0开始调，C越大，决策边界越小

[展开全文]

3077_Yuki · 2022-07-13 · 131 - 7 2.3.2 重要参数C & 总结.mp4 0

边际更宽的决策边际更好

找最大边际和被分错样本之间的平衡

[展开全文]

3077_Yuki · 2022-07-13 · 130 - 7 2.3.1 SVM在软间隔数据上的推广.mp4 0

poly通常用网格搜索调，rbf

[展开全文]

3077_Yuki · 2022-07-13 · 129 - 7 2.2.5 案例：在乳腺癌数据集上对核函数进行调参 (2).mp4 0

与参数

1) degree：默认3，只在poly时可选

2) gamma：默认auto，除linear都可用

3) coef0：默认0，只在poly,sigmoid有效

[展开全文]

3077_Yuki · 2022-07-13 · 128 - 7 2.2.5 案例：在乳腺癌数据集上对核函数进行调参 (1).mp4 0

np.c_类似np.vstack的功能

ax.text为图像上放上文字

[展开全文]

3077_Yuki · 2022-07-13 · 126 - 7 2.2.3 案例：如何选取最佳核函数 (2).mp4 0

如何使用np.mgrid生成网格？

np.mgrid合并np.linspace和np.meshgrid

xx,yy=np.mgrid[xmin:xmax:200j,ymin:ymax:200j]

[起始值：结束值：步长]

200j表示起始值和结束值之间创建200个点，结束值包含在内

[展开全文]

3077_Yuki · 2022-07-13 · 125 - 7 2.2.3 案例：如何选取最佳核函数 (1).mp4 0

三、非线性SVM与核函数

1、核变换：把数据投影到高维空间中，寻找能将数据完美分割的超平面。

2、核函数使得高维空间的任意两个向量的点积一定可以用低维空间这两个向量的某种计算表示

3、重要参数kernel：

1)"linear"：线性核函数，线性

2) "poly": 多项式核，偏线性

3) "sigmoid": 双曲正切核，非线性

4) "rbf": 高斯径向基，偏非线性

[展开全文]

3077_Yuki · 2022-07-13 · 124 - 7 2.2.1 & 2.2.2 非线性SVM与核函数：重要参数kernel.mp4 0

intercept_

[展开全文]

3077_Yuki · 2022-07-12 · 176 - 9 2.3 多元线性回归的参数，属性及建模代码.mp4 0

线性回归

一、概述

回归的预测结果是连续型变量

二、多元（多个特征）线性回归LinearRegression

1、linear_model.LinearRegression使用的损失函数：SSE（误差平方和）或RSS（残差平方和）

2、最小二乘法：

1）通过最小化真实值与预测值之间的RSS来求解参数

2）最小二乘法求解线性回归是一种无偏估计的方法，要求标签必须服从正态分布

三、回归类的模型评估指标

四、多重共线性：岭回归和Lasso

五、非线性问题：多项式回归

逆矩阵存在的充分必要条件是特征矩阵不存在多重共线性

[展开全文]

3077_Yuki · 2022-07-12 · 175 - 9 2.2 用最小二乘法求解多元线性回归的过程.mp4 0

线性回归

一、概述

回归的预测结果是连续型变量

二、多元（多个特征）线性回归LinearRegression

1、linear_model.LinearRegression使用的损失函数：SSE（误差平方和）或RSS（残差平方和）

三、回归类的模型评估指标

四、多重共线性：岭回归和Lasso

五、非线性问题：多项式回归

[展开全文]

3077_Yuki · 2022-07-12 · 174 - 9 2.1 多元线性回归的基本原理和损失函数.mp4 0

线性回归

一、概述

二、多元线性回归LinearRegression

三、回归类的模型评估指标

四、多重共线性：岭回归和Lasso

五、非线性问题：多项式回归

[展开全文]

3077_Yuki · 2022-07-12 · 173 - 9 1 概述，sklearn中的线性回归大家族.mp4 0

线性回归

一、概述

二、多元线性回归LinearRegression

三、回归类的模型评估指标

四、多重共线性：岭回归和Lasso

五、非线性问题：多项式回归

[展开全文]

3077_Yuki · 2022-07-12 · 172 - ===【经典算法】9 线性回归 ===.mp4 0

ROC曲线

衡量在尽量捕捉少数类时，误伤多数类的情况如何变化（recall与

[展开全文]

3077_Yuki · 2022-07-12 · 144 - 8 2.2 ROC曲线：Recall与假正率FPR的平衡.mp4 0

混淆矩阵

二分类中极为有效，少数类为正例，多数类为负例

1）真实值在预测值之前，两数字相同则预测正确

2）所有指标范围在[0,1]，11、00为分子的指标越接近1越好，01、10分子的指标越接近0越好

3）sklearn中没有特异度和假正率，需要自己计算

6个指标

1、准确率Accuracy

2、捕捉少数类

1）精确度Precision(查准率）：

越低，误伤了过多的多数类，衡量多数类判错付出的成本

将多数类判错成本高昂时，追求高精确度

2）召回率Recall(敏感度、真正率、查全率）

越高，捕捉出了越多的少数类

不计一切代价找出少数类，追求高召回率

召回率和精确度此消彼长，代表捕捉少数类的需求和不误伤多数类需求的平衡

3）F1 measure：范围[0,1]，越接近1越好，代表精确度和召回率越高

3、判错多数类

1）特异度specificity（真负率）

衡量一个模型把多数类判断正确的能力

2）假正率false positive rate=1-特异度

衡量一个模型把多数类判断错误的能力

[展开全文]

3077_Yuki · 2022-07-12 · 143 - 8 2.1.4 sklearn中的混淆矩阵.mp4 0

SVC模型评估指标

1、混淆矩阵

二分类中极为有效，少数类为正例，多数类为负例

1）真实值在预测值之前，两数字相同则预测正确

2）所有指标范围在[0,1]，11、00为分子的指标越接近1越好，01、10分子的指标越接近0越好

6个指标

1、准确率Accuracy

2、捕捉少数类

1）精确度Precision(查准率）：

越低，误伤了过多的多数类，衡量多数类判错付出的成本

将多数类判错成本高昂时，追求高精确度

2）召回率Recall(敏感度、真正率、查全率）

越高，捕捉出了越多的少数类

不计一切代价找出少数类，追求高召回率

召回率和精确度此消彼长，代表捕捉少数类的需求和不误伤多数类需求的平衡

3）F1 measure：范围[0,1]，越接近1越好，代表精确度和召回率越高

3、判错多数类

1）特异度specificity（真负率）

衡量一个模型把多数类判断正确的能力

2）假正率false positive rate=1-特异度

衡量一个模型把多数类判断错误的能力

[展开全文]

3077_Yuki · 2022-07-12 · 142 - 8 2.1.3 对多数类样本的关怀：特异度Specificity与假正率FPR.mp4 0

SVC模型评估指标

1、混淆矩阵

二分类中极为有效，少数类为正例，多数类为负例

1）真实值在预测值之前，两数字相同则预测正确

2）所有指标范围在[0,1]，11、00为分子的指标越接近1越好，01、10分子的指标越接近0越好

6个指标

1、准确率Accuracy

2、

1）精确度Precision(查准率）：

越低，误伤了过多的多数类，衡量多数类判错付出的成本

将多数类判错成本高昂时，追求高精确度

2）召回率Recall(敏感度、真正率、查全率）

越高，捕捉出了越多的少数类

不计一切代价找出少数类，追求高召回率

召回率和精确度此消彼长，代表捕捉少数类的需求和不误伤多数类需求的平衡

3）F1 measure：范围[0,1]，越接近1越好，代表精确度和召回率越高

[展开全文]

3077_Yuki · 2022-07-12 · 141 - 8 2.1 样本不平衡的艺术(2)：召回率Recall与F1 measure.mp4 0

SVC模型评估指标

1、混淆矩阵

二分类中极为有效，少数类为正例，多数类为负例

1）真实值在预测值之前，两数字相同则预测正确

2）所有指标范围在[0,1]，11、00为分子的指标越接近1越好，01、10分子的指标越接近0越好

6个指标

1、准确率Accuracy

2、精确度Precision(查准率）：

越低，误伤了过多的多数类，衡量多数类判错付出的成本

将多数类判错成本高昂

[展开全文]

3077_Yuki · 2022-07-12 · 140 - 8 2.1 样本不平衡的艺术(1)：精确度Precision.mp4 0

SVC模型评估指标

1、混淆矩阵

二分类中极为有效，少数类为正例，多数类为负例

1）真实值在预测值之前，两数字相同则预测正确

2）所有指标范围在[0,1]，11、00为分子的指标越接近1越好，01、10分子的指标越接近0越好

3）6个指标

准确率Accuracy

[展开全文]

3077_Yuki · 2022-07-12 · 139 - 8 2.1 混淆矩阵与准确率.mp4 0

SVC模型评估指标

[展开全文]

3077_Yuki · 2022-07-12 · 138 - 8 2 SVC的模型评估指标.mp4 0

核变换：把数据投影到

[展开全文]

3077_Yuki · 2022-07-12 · 123 - 7 2.1.4 线性SVM的求解过程的可视化 (6).mp4 0

授课教师

森陌夏栀

高级算法工程师

teacher03

teacher02

teacher01

老师

课程特色

图文(1)

视频(264)

考试(19)

学员动态

2970 完成了课件资料下载

2970 开始学习课件资料下载

3683_徐天宇开始学习 005 - 1 4. 分类树：...

2961李致远人工智能完成了 007 - 1 5. 分类树：...

2961李致远人工智能完成了 001 - 00 课程介绍.m...

授课教师

课程特色

最新学员

学员动态