一、概述
1、无监督学习:训练时只需要一个特征矩阵x,不需要标签y,例如PCA
2、聚类(无监督分类)VS 分类
1)在已经知晓的类别上,给未知的样本标上标签(分类);在完全不知道标签的情况下,探索分布上的分类(聚类)
2)分类结果确定,聚类结果不确定
3、sklearn中的聚类算法(类和函数两种表现形式)输入数据可以是标准特征矩阵,也可以是相似性矩阵(行和列都是n_samples),可以使用sklearn.metric.pairwise模块中函数获取相似性矩阵
4、簇中所有数据均值为这个簇的质心,簇k是一个超参数
RFM模型,漏斗分析,AARRR模型