自由式学习
936人加入学习
(0人评价)
机器学习算法基础(基础机器学习课程)
价格 免费
承诺服务
该课程属于 1446-肖同学-算法方向-计算机视觉-就业:否 请加入后再学习

特征选择:方差过滤

```python
from sklearn.feature_selection import VarianceThreshold #特征选择,根据方差进行过滤
def var():
    '''
    特征选择-选择低方差的特征
    :return:None
    '''
    var=VarianceThreshold(threshold=1.0)#保留方差值为1的数值
    data=var.fit_transform([[0,2,0,3],[0,1,4,3],[0,1,1,3]])#三行四列的二维数组
    print(data)
    return None

if __name__=='__main__':  #调用
 var()
```

PCA:主成分分析   

把维度降低,但是数据信息尽可能不损耗

 

 

 

 

 

[展开全文]

数据降维

1.特征选择

2.主成分分析

 

[展开全文]

## 数据降维

> 维度:特征的数量

> 为什么要降维:删除一些不必要的特征

- 特征选择

- 主成分分析

### 特征选择

特征选择的原因

- 冗余:部分特征相关度高,容易消耗计算性能

- 噪声:部分特征对预测结果有影响

特征选择的主要方法

- filter 过滤式 variance threshold

- embedded 嵌入式 正则化、决策树

- wrapper 包裹式

### 过滤式特征选择

sklearn.feature_selection.VarianceThreshold

 

> 特征之间容易相关 对于高纬度数据来说

n_components:

- 小数 百分比(0~1)保留多少信息 一般取90~95%

- 整数  减少到的特征数量

一般使用小数

[展开全文]