## numpy读取本地数据
numpy读取数据
np.loadtxt(fname,dtype=np.float,delimiter=None,skiprows=0,usecols=None,unpack=False)
## numpy读取本地数据
numpy读取数据
np.loadtxt(fname,dtype=np.float,delimiter=None,skiprows=0,usecols=None,unpack=False)
###数组的计算
np.shape()只有一个值是一维的,指的是有多少个元素
两个值,二维,指几行几列
三个值,三维
np.reshape((3,4))把什么变成三行四列形式
```python
import numpy as np t1=np.arange(32).reshape((2,4,4)) print(t1)
```
t1.flatten()可以快速把数据按顺序变成二维的
1.广播机制:数组与数字直接运算
2.特例:t1/0 :0/0=nan,数字/0=inf
3.数组与数组计算,长度相同时,按维度依次计算
## numpy学习(处理数字性数据)
1.np.array()把内容变成数组
2.t1.dtype可以显示其类型
3.np.astype可以把类型改变
4.保存固定位的小数
np.round(range(10),3)
### 总结四种方法
matplotlib.plot()折线图
matplotlib.bar 条形图
matplotlib.scatter 散点图
matplotlib.hist 直方图
更多绘图软件:Aoache ECharts
#### 绘制直方图
组数=极差/组距
#### 条形图
plt.bar 竖着的条形图,线条粗细是width(线条的宽度)
plt.barh 横着的条形图,线条粗细成了height(线条的高低)
plt.grid 是添加网格,alpha是透明度
回归>>>均方误差MSE
#### 散点图是plt.scatter
遗忘知识点:
plt.legend(loc="uppper left",prop=my_font)
###
plt.grid绘制网格
plt.grid(alpha=0.5)#alpha这个代表透明度
plt.plot(linestyle=':')表示折线变成虚线
color=''#线条颜色
linestyle=''#折线的形式
linewidth=5#线条粗细
alpha=0.5#透明度
以上都是放在plt.plot中的
随机森林>>>分类器比较好用吗?
random_state是不同的特征作为初始的节点来产生的不同的树,所以需要不同的特征
袋装法,有放回的随机抽样技术
n个样本组成的自助集
bootstrap>>默认为True
袋外数据(out of bag data,简写为oob)
criterion 不纯度的衡量指标
有基尼系数和信息熵,信息熵的增益
n_estimators 这是森林中树木的数量,基评估器的数量,default-10
实例化-交叉验证
波动本质上是一样的, 但集成算法压倒性的强
集成算法
调参曲线,交叉验证,网格算法 调参方法
base estimator 基评估器
boosting 结合弱评估器一次次对难以评估的对象进行攻克
对特征提问得出决策规则-决策树
# 函数rotation=90旋转的度数
###调整x或者y轴上的参数
1.from matplotlib import pyplot as plt引入函数
2.plt.figure(figsize=(20,8),dpi=80)
#figurezide图片大小,(长,宽),dpi越大越不容易失真
from matplotlib import pyplot as plt x=range(2,26,2) y=[15,13,14,5,17,20,25,26,26,27,22,18,15] #设置图片大小 #figurezide图片大小,(长,宽),dpi越大越不容易失真 plt.figure(figside=(20,8),dpi=80) #绘图 plt.plot(x,y) #设置x轴 _xtick_labels=[i/2 for i in range(2,49)] plt.xticks(_xtick_labels[::3]) #保存 #plt.savefig("./t1.png") #展示 plt.show()
字符串的变量
可用 == 和 is 来判断是否是同个id
只有包含下划线字母数字的字符才能进入驻留,特殊符号不可以,所以id会发生变化。
字符串成员操作符: in , not in
1.split(x) 以'x'为界限分割字符串 x可以是空格,单字符,多字符
2.‘x’.join(y) y中的字符串,以x为分隔,拼接成一个大字符串
使用【:】取字符串的片段
[:]:取全部
[2:]从第三个位置到最后
[2:5]从第三个位置到第五个位置 注:包头不包尾
[1:5:x] 在位置1:5之间每隔x取一个
也可以用'-'号进行反向取值,同样包头不包尾
[::-1],反向排
1.str() 注:转化数据为字符串
2.通过[]提取字符串 注:第一个字符为0,最后一个字符为len(str)-1,既可以正向提取,也可以反向向提取
3.replace在字符串中的应用
例:a = 'xy'
a.replace('x','y')
print(a)
输出: 'yy'
1.转义符号的使用
2.字符串可通过+进行拼接操作(需两个为字符串)
3.字符串可通过*号进行复制
4.通过end=“”,来避免换行
使用 input()从控制台读取键盘输入内容
myname = input('请输入名字:')
请输入名字:x
print(myname)
输出 'x'
1.同一运算符:is ,is not
区别:is判断的是地址
==判断的是值
注:在-5,256之间数值会缓存,所以id是相同的,不同解释器不同