机器学习-Sklearn（第三版） - 拜师教育 - 师徒制教育平台|人工智能培训|大数据培训|JAVA培训|PYTHON培训|

748人加入学习

(0人评价)

机器学习-Sklearn（第三版）

价格免费

教学计划

学习有效期 365 天（随到随学）

三、聚类算模型的评估指标

思路：由于KMeans目标是簇内差异小，簇外差异大，因此可以通过衡量簇内差异来衡量聚类效果

1、标签y已知（最好用分类）

互信息分、V-measure、调整兰德系数，三者都是越高越好，前两个取值[0,1]，最后一个取值[-1,1]

2、标签y未知：轮廓系数

1）评价簇内稠密程度、簇间离散程度。样本与所在簇内其他样本相似度为a，其他簇内样本相似度为b，用平均距离计算。a越小，b越大，越好。

2）轮廓系数是对每一个样本进行计算，公式为s=(b-a)/max(a,b)，范围：（-1,1）

轮廓系数处于(0,1)：聚类好，越接近1越好

处于（-1,0）：聚类不好

3）使用sklearn.metrics中的silhouette_score计算，返回所有轮廓系数的均值，silhouette_samples返回每个样本的轮廓系数

from sklearn.metrics import silhouette_score
silhouette_score(x,y_pred)

3077_Yuki · 2022-07-10 · 096 - 6 3.1.2 聚类算法的模型评估指标 (2) - 轮廓系数.mp4 0

森陌夏栀

高级算法工程师

teacher03

teacher02

teacher01

老师

图文(1)

视频(264)

考试(19)

2970 完成了课件资料下载

2970 开始学习课件资料下载

3683_徐天宇开始学习 005 - 1 4. 分类树：...

2961李致远人工智能完成了 007 - 1 5. 分类树：...

2961李致远人工智能完成了 001 - 00 课程介绍.m...