1.Python有一个简单的字符串格式化方法,使用%做占位符,%后面跟变量。
2.%(占位符)
3./n(换行作用)
4.format
5.input(输入)
6.type(查询类型)
格式化符号:
1.%c
2.%s
3.%i
4.%d
5.%u
6.%o
7.%X
8.%e
9.%E
10.%f
11.%g
12.%G
1.Python有一个简单的字符串格式化方法,使用%做占位符,%后面跟变量。
2.%(占位符)
3./n(换行作用)
4.format
5.input(输入)
6.type(查询类型)
格式化符号:
1.%c
2.%s
3.%i
4.%d
5.%u
6.%o
7.%X
8.%e
9.%E
10.%f
11.%g
12.%G
hist 直方图
from matplotlib import pyplot as plt
from matplotlib import font_manager
a=[zifuchuan]
plot.hist(a.fenzushu)
细节
计算组数=num_bin= (max(a)-nim(b)//d)
d=5
组数= 极差/组距
x轴的刻度设置
plt.xticks(range(min(a),max(a)+d,d))
plt.show()
图形大小:plt.figure(figsze=(20,8),dpi=80)
{数据}
算术运算符:
1.+(加法)
2.-(减法)
3.*(乘法)
4.**(指数)
5.%(取余)
6./(除法)
7.//(地板除)
比较运算符:
1.==(等于)
2.!=(不等于)
3.>(大于)
4.<(小于)
5.>=(大于等于)
6.<=(小于等于)
Python基本类型:
1.字符串
2.元组
3.字典
4.列表
数字:
5..int
6.long
7.float
8.布尔值
9.变量必须以字母或下划线开头
10.其他字符可以是字母,数字或__(下划线)
11.变量区分大小写
12.不能用关键字来做变量名
1.变量=储存的数据。
2.变量不仅仅可以是数字,还可以是其他的任意类型。
3.我们可以通过定义变量来申请并命名这样的存储空间,并通过变量的名字来使用这段储存空间。
4.变量是程序中临时储存数据的场所。
数组的形状
shape即可查看数组的各个维度长度(输出按三维二维依次降低,块、行、个)
reshape方法可以重新设置行列,是有返回值的,而不改变本身
有返回值才会输出
结合shape和reshape可以做到在不清楚维度长度的情况下降维
flatten可以将数组展开变成一维
数组的计算
numpy数组对数字进行+*-/计算,是对全部单元进行计算
nan>>not a number 0/0
inf>>infinite x/0
数组对数组进行计算:
不同维度的数组进行计算至少有一个维度的长度相同
广播会在缺失或者长度为1的维度上进行(不同维度的计算本质上是广播)
广播原则:如果两个数组的后缘维度,即从末尾开始算起的维度轴长相符,或者某一方的长度为1,即广播jian'r
一维数组只有0轴,二维有0、1轴,三维有0、1、2轴
reshape(0,1,2),shape输出(2,1,0)
CSV逗号分隔值文件
numpy的读取文件方法
unpack参数实现行列转置
transpose,T,swapaxes(1,0)方法实现行列转置
fsfada
numpy的索引和切片
索引从0开始
2:取得连续多行,[[2,5,6]]多一个[]取得不连续的行
:,1取得单列
:,1:取得连续列
:,[]取得不连续列
取得行列交叉的内容
取得不相邻的点
异常类型:
mysql数据查询
条件查询:
比较条件: > < = != <> 跟在where后面
in 查询 指定一个数据容器
between 表示一个区间 1到10 还可以表示时间范围
null值的判断 如果是一个空值对象的话 用is判断
如果是空字符串的话,则使用 = 判断
排序 order by 【asc升序 desc降序】可以指定多个字段排序;
聚合函数:
count()
max()
min()
length()
sum()
avg()
round()
date()
substr() left right
分组和分页
分组 group by
as 取别名
分组条件的筛选 where having
where 跟在from后面
having跟在group by后面
limit分页 select * from student limit start(起始位置) count(读取数量)
连接查询
内连接:inner join 两种表共同的数据
左连接:left join 参考左边的表为基准查询表,右边的表用null填充;
右连接 right join 参考右边的表为基准查询表,左边的表用null填充
子查询
1、标量查询 一行一列查询 单个值
2、列级子查询 一行多列 多个值
3、行级子查询 多行一列
4、表级子查询 多行多列【用来做数据源】
保存查询结果:
insert into 表名 select 查询来充当数据源;
union去重输出
union all 输出多次查询的结果;
这个老师的逻辑能力和语言组织能力真的是匮乏 前言不搭后语 自己把自己绕进去了
讲的真垃圾
这课程讲的就和拿着稿子照本宣科一样
如果要计算某个维度下的用户数,不要直接count()
#apply返回每个测试样本所在叶子节点的索引
clf.apply(xtext)
#predict返回每个测试样本的分类、回归结果
clf.predict(xtest)
#决策树 # from sklearn import tree#导入需要的模块 # clf=tree.DecisionTreeClassifier()#实例化 # clf=clf.fit(x_train,y_train)#用训练集数据训练模型 # result=clf.score(x_test,y_test)#导入测试集,从接口中调用需要的信息进行打分
citerion:不纯度,不纯的越低,训练集拟合越好
机器学习
排序:
字符串及常用方法: