三、处理分类型特征:编码与哑变量
1、preprocessing.LabelEncoder:把分类转换为分类数值
classes_属性,查看标签中有多少类别
2、preprocessing.OrdinalEncoder:特征编码模块,把分类转换成数字,类别独立
categories_属性,查看每个特征中有多少类别
3、preprocessing.OneHotEncoder:独热编码,特征转换成哑变量,分类有联系
参数categories,='auto'自己找找有几类
接口get_feature_names():返回稀疏矩阵每一列列的类别
独热编码处理方法:合并表,删除列,改列索引
4、preprocessing.LabelBinarizer标签