自由式学习
748人加入学习
(0人评价)
机器学习-Sklearn(第三版)
价格 免费
该课程属于 1515-小刀-算法方向-金融风控-就业:是 请加入后再学习

三、处理分类型特征:编码与哑变量

1、preprocessing.LabelEncoder:把分类转换为分类数值

classes_属性,查看标签中有多少类别

2、preprocessing.OrdinalEncoder:特征编码模块,把分类转换成数字,类别独立

categories_属性,查看每个特征中有多少类别

3、preprocessing.OneHotEncoder:独热编码,特征转换成哑变量,分类有联系

参数categories,='auto'自己找找有几类

接口get_feature_names():返回稀疏矩阵每一列列的类别

独热编码处理方法:合并表,删除列,改列索引

4、preprocessing.LabelBinarizer标签 

[展开全文]

处理分类型特征:编码与哑变量

LabelEncoder:标签专用,能够将分类转换为分类数值

OrdinalEncoder:特征专用,能够将分类特征转换为分类数值

OneHotEncoder:独热编码,创建哑变量

类别OrdinalEncoder可以用来处理有序变量,但对于名义变量,我们只有使用哑变量的方式来处理,才能够尽量向算法传达最准确的信息:

 

[展开全文]