2200-Tom-算法方向-数据挖掘方向-就业:否 已关闭

2200-Tom-算法方向-数据挖掘方向-就业:否 扫二维码继续学习 二维码时效为半小时

(0评价)
价格: 免费

列表的创建  

可存储任何数据,索引下表获取值

range()创建整数列表

range([start,] end [,step])

start参数:可选,起始

end参数:必选,结尾

step参数:可选,步长

循环创建多个元素

a = [ x*2  for  x  in  range(5)]

>>>a

[0,2,4,6,8]

if过滤元素

a = [ x*2  for  x  in  range(100) if x%9==0]

>>>a

[0,18,36,54,72,.......,198]

[展开全文]

python的序列

数据存储方法:字符串、列表、元组、字典、集合

存地址、轻量级

列表大小可变

[展开全文]

Python基础课

一、可变字符串

字符串定义以后是不可变的,不能原地修改吗,

 

 

[展开全文]

思考:对于一组电影数据,如果要对这些数据进行分类,应该如何操作?

首先,先构一个二维数组,行数等于gener_list的数据量,即取出来genre这一列的数据,通过逗号进行分割,即将每一行数据分割出来一二维数据的形式返回列表中

df["Genre"].str.split(",").tolist()

然后将这个list里面的数据都转换为一维数组且去重

再构建一个新的二维数组,最初的值都为零,行是genre 的数据量,列表是一维数组的数据量,分类最为列索引

 

 

[展开全文]

分解问题

确认坐标系0点

按照思路敲代码

"报错的文字里总有认识的单词”

[展开全文]

搜索“CMD"
输入“python”

[展开全文]

pandas里面计算mean()时,可以直接跳过nan,来返回其他值得平均数

 

[展开全文]

#显示所有列
pd.set_option('display.max_columns', None)
#显示所有行
pd.set_option('display.max_rows', None)

[展开全文]
1757_N_DZ · 2021-05-06 · 解锁式学习 0

pandas的索引

1.df.loc 通过标签引行数据
2.df.iloc 通过位置取行数据
[展开全文]

为什么要学习pandas?

numpy处理数值型数据;pandas用来处理字符串和时间序列等

pandas的常用数据类型

(1)series——一维、带标签的数组

(2)DataFrame——二维数组

 

[展开全文]

ndarray缺失值填充均值

 

[展开全文]

numpy 中的nan 和 inf

nan:not a number表示不是一个数字

当我们读取本地的文件为float时,如果有缺失,就会出现nan,当做了一个不合适的计算的时候也会出现nan(比如无穷大inf减去无穷大)

特殊属性:(1)两个nan是不相等的;(2)np.nan != np.nan;(3)利用以上特性,判断数组中nan的个数;(4)通过np.isnan(t)来判断nan有几个;(5)nan跟任何一个数进行计算都是nan

在一组数据中单纯将nan替换为0并不合适,很多时候会把缺失值替换成均值(中值)或者直接删除有缺失值的一行。

求和:t.sum(axis=None)

均值:t.mean(axis=None)  受离群点的影响较大

中值:np.median(t,axis=None)

最大值:t.max(axis=None)

最小值:t.min(axis=None)

极值:np.ptp(t,axis=None) 即最大值和最小值只差

标准差:t.std(axis=None)

inf:表示真无穷;-inf表示负无穷

什么时候出现inf或-inf?比如一个数字除以0

[展开全文]

numpy中数值的修改

numpy中布尔索引

numpy中三元运算符

numpy中的clip(裁剪)

 

[展开全文]

轴:

numpy中可以理解为方向,使用0,1,2...数字表示,对于一个一维数组,只有一个0,对于2维数组(shape(2,2)),0轴和1,对于三维数组(shape(2,2, 3)),0,1,2

二维数组的轴:

三维数组的轴:

numpy读取数据

csv:逗号分割值文件

 

numpy中的转置

转置是一种变换,对于numpy中的数组来说,就是对角线方向交换数据,目的也是为了更方便处理数据

转置方法:(1)transpose();(2)T;(3)swapaxes(1,0)

 

[展开全文]

数组的形状

数组的计算

广播原则

如果两个数的后缘维度(即从末尾开始算起的维度)的轴长度相符或者其中一方的长度为1则认为它们是广播兼容的、广播会在确实和(或)长度为1的维度上进行

 

[展开全文]

什么是numpy?

numpy是用来帮我们处理数值型数据的模块,躲在大型、多维数组上执行数值运算

为什么要学习numpy?

(1)快速

(2)方便

(3)科学计算的基础库

[展开全文]