3886-云风-人工智能学科-数据挖掘 - 拜师教育 - 师徒制教育平台|人工智能培训|大数据培训|JAVA培训|PYTHON培训|

3886-云风-人工智能学科-数据挖掘 3886-云风-人工智能学科-数据挖掘

(0评价)

价格：免费

学员(1)

课程(0)

### 字典特征数据抽取

> 特征抽取：文本，字符串

> sklearn特征抽取API

- 字典特征抽取

sklearn.feature_extraction.Dictvectorizer

### Dictvectorizer语法

DictVectorizer.fit_transform(x)

返回sparse矩阵

### 流程

- 实例化DictVectorizer

- 输入数据并转换 fit_transform()

1411_Y_James · 2020-12-05 · 自由式学习 0

### 数据对于特征的处理

pandas：一个数据读取非常方便以及基本的处理格式的工具

- 缺失值

- 数据转换

- 重复值（机器学习中不需要进行去重）

sklearn：对于特征的处理提供了强大的接口

特征工程

> 概念：将原始数据转换为更好地代表预测模型的潜在问题的特征的过程，从而提高了对未知数据的预测准确性

> 意义：直接影响预测结果

### sklearn

> python语言的机器学习工具

> 机器学习算法的实现

- 数据的特征抽取

- 数据的特征预处理

- 数据的降维

1411_Y_James · 2020-12-05 · 自由式学习 0

链式赋值：x = y = 123

系列解包赋值：a,b,c = 1,2,3

变量互换:a,b = b,a

续航符：a = 'aaaaa/bbbb'
print（a)
<<<aaaaabbbb

切片操作：a = 'aasdffghhjjk'

a[1:2:3]

1175_Y_陈正伟 · 2020-07-08 · 自由式学习 0

3886-云风-人工智能学科-数据挖掘 3886-云风-人工智能学科-数据挖掘 扫二维码继续学习 二维码时效为半小时