自由式学习
1人加入学习
(0人评价)
机器学习-数据科学库(HM)
价格 免费
该课程属于 1411-李同学-算法方向-自然语言处理-就业:是 请加入后再学习

### 12、布尔索引

df[df["Count_AnimalName"]>800]

df[(df["Count"]>800)&(df["count"]<1000)]

df["info"].str.split("/").tolist() #将info标签下的列转为字符串切割再放到一个列表中。

### 13、缺失数据的处理

- nan

- 0

> 判断是否为nan

pd.isnull(df)

pf.notnull(df)

> 处理方式

- 删除nan所在的行列

dropna(axis=0,how="any",inplace=False) 

- any只要有一个为nan就删除

- all 全部为nan才删除

- inplace:是否进行原地修改

- 填充数据

t.fillna(t.mean()),

t2["age"]=t2["age"].fillna(t2["age"].mean())
print(t2)

t.fillna(t,median())

t.fillna(0)

> 处理为0的数据

t[t==0]=np.nan

 

 

[展开全文]

授课教师

高级算法工程师
老师

课程特色

考试(7)
图文(1)
视频(41)

最新学员