matplotlib
- 可以将数据进行可视化,更直观的呈现,是数据更加客观有说服力;是Python的底层绘图库;
- 基本要点:
- axis轴:x或y轴;
-
from matplotlib import pyplot as plt(命名为plt简写)
matplotlib
from matplotlib import pyplot as plt(命名为plt简写)
数据分析的介绍
切片和索引
1.选择行 t【2】
2.选择列t【3:,:】
3.选择行列 连续的多行 t[2:,:3]
4.索引 t【2,3】
### numpy中的nan和inf
1.当本地文件为float的时候,有缺失时,会出现nan
或者做义工不适合的计算时
2.inf表示正无穷,-inf是负无穷
### numpy常用统计函数
1.求和:np.sum(t3,axis=0)是计算行上的结果
(axis=1是计算列上的结果)
2.均值:np.mean(t,axis=0)
3.中值:np.median(t3,axis=0)
4.最大值:np.max(axis=0)
5.最小值:np.min(axis=0)
6.极值:np.ptp(t3,axis=0)
7.标准差:np.std(axis=0)
标准差反应数据的波动情况,越大则越分散
## numpy好用的方法
1.获得最大值最小值的位置
np.argmax(t,axis=0)
np.argmin(t.axis=1)
2.创建一个全为0的数组:np.zeros((3,4))
3.创建一个全为1的数组:np.ones((3,4))
4.创建一个对角线为1的正方形数组(方阵):
np,eye(3)
## numpy生成随机数
##数组的拼接
#竖直拼接
np.vstack((t1,t2))
#水平拼接
np.hstack((t1,t2))
#行交换
t[[1,2],:]=t[[2,1],:]
#列交换
t[:,[0,2]]=t[:,[2,0]]
np.where(t<10,0,10)#numpy三元运算符
如果t<10,则为0,否则为10
np.clip(10,18)#numpy的裁剪
关键字,不能作为变量名,使用help()查看关键字,变量以字母或者下划线开头,后接字母下划线数字
## numpy读取本地数据
numpy读取数据
np.loadtxt(fname,dtype=np.float,delimiter=None,skiprows=0,usecols=None,unpack=False)
###数组的计算
np.shape()只有一个值是一维的,指的是有多少个元素
两个值,二维,指几行几列
三个值,三维
np.reshape((3,4))把什么变成三行四列形式
```python
import numpy as np t1=np.arange(32).reshape((2,4,4)) print(t1)
```
t1.flatten()可以快速把数据按顺序变成二维的
1.广播机制:数组与数字直接运算
2.特例:t1/0 :0/0=nan,数字/0=inf
3.数组与数组计算,长度相同时,按维度依次计算
## numpy学习(处理数字性数据)
1.np.array()把内容变成数组
2.t1.dtype可以显示其类型
3.np.astype可以把类型改变
4.保存固定位的小数
np.round(range(10),3)
### 总结四种方法
matplotlib.plot()折线图
matplotlib.bar 条形图
matplotlib.scatter 散点图
matplotlib.hist 直方图
更多绘图软件:Aoache ECharts
#### 绘制直方图
组数=极差/组距
#### 条形图
plt.bar 竖着的条形图,线条粗细是width(线条的宽度)
plt.barh 横着的条形图,线条粗细成了height(线条的高低)
plt.grid 是添加网格,alpha是透明度
#### 散点图是plt.scatter
遗忘知识点:
plt.legend(loc="uppper left",prop=my_font)
###
plt.grid绘制网格
plt.grid(alpha=0.5)#alpha这个代表透明度
plt.plot(linestyle=':')表示折线变成虚线
color=''#线条颜色
linestyle=''#折线的形式
linewidth=5#线条粗细
alpha=0.5#透明度
以上都是放在plt.plot中的
# 函数rotation=90旋转的度数
###调整x或者y轴上的参数
1.from matplotlib import pyplot as plt引入函数
2.plt.figure(figsize=(20,8),dpi=80)
#figurezide图片大小,(长,宽),dpi越大越不容易失真
from matplotlib import pyplot as plt x=range(2,26,2) y=[15,13,14,5,17,20,25,26,26,27,22,18,15] #设置图片大小 #figurezide图片大小,(长,宽),dpi越大越不容易失真 plt.figure(figside=(20,8),dpi=80) #绘图 plt.plot(x,y) #设置x轴 _xtick_labels=[i/2 for i in range(2,49)] plt.xticks(_xtick_labels[::3]) #保存 #plt.savefig("./t1.png") #展示 plt.show()
字符串的变量
可用 == 和 is 来判断是否是同个id
只有包含下划线字母数字的字符才能进入驻留,特殊符号不可以,所以id会发生变化。
字符串成员操作符: in , not in
1.split(x) 以'x'为界限分割字符串 x可以是空格,单字符,多字符
2.‘x’.join(y) y中的字符串,以x为分隔,拼接成一个大字符串