seek( )
如果在操作文件的过程,需要定位到其他位置进行操作,用seek( )
seek(offset,form)有2个参数,offset,偏移量单位字节,负数是往回偏移,正数是往前偏移,form位置:0表示文件开头,1表示当前位置,2表示文件末尾
## numpy读取本地数据
numpy读取数据
np.loadtxt(fname,dtype=np.float,delimiter=None,skiprows=0,usecols=None,unpack=False)
###数组的计算
np.shape()只有一个值是一维的,指的是有多少个元素
两个值,二维,指几行几列
三个值,三维
np.reshape((3,4))把什么变成三行四列形式
```python
import numpy as np t1=np.arange(32).reshape((2,4,4)) print(t1)
```
t1.flatten()可以快速把数据按顺序变成二维的
1.广播机制:数组与数字直接运算
2.特例:t1/0 :0/0=nan,数字/0=inf
3.数组与数组计算,长度相同时,按维度依次计算
## numpy学习(处理数字性数据)
1.np.array()把内容变成数组
2.t1.dtype可以显示其类型
3.np.astype可以把类型改变
4.保存固定位的小数
np.round(range(10),3)
### 总结四种方法
matplotlib.plot()折线图
matplotlib.bar 条形图
matplotlib.scatter 散点图
matplotlib.hist 直方图
更多绘图软件:Aoache ECharts
#### 绘制直方图
组数=极差/组距
#### 条形图
plt.bar 竖着的条形图,线条粗细是width(线条的宽度)
plt.barh 横着的条形图,线条粗细成了height(线条的高低)
plt.grid 是添加网格,alpha是透明度
回归>>>均方误差MSE
#### 散点图是plt.scatter
遗忘知识点:
plt.legend(loc="uppper left",prop=my_font)
###
plt.grid绘制网格
plt.grid(alpha=0.5)#alpha这个代表透明度
plt.plot(linestyle=':')表示折线变成虚线
color=''#线条颜色
linestyle=''#折线的形式
linewidth=5#线条粗细
alpha=0.5#透明度
以上都是放在plt.plot中的
随机森林>>>分类器比较好用吗?
random_state是不同的特征作为初始的节点来产生的不同的树,所以需要不同的特征
袋装法,有放回的随机抽样技术
n个样本组成的自助集
bootstrap>>默认为True
袋外数据(out of bag data,简写为oob)
criterion 不纯度的衡量指标
有基尼系数和信息熵,信息熵的增益
n_estimators 这是森林中树木的数量,基评估器的数量,default-10
实例化-交叉验证
波动本质上是一样的, 但集成算法压倒性的强