3343-张继初-Python学科-数据分析-就业:否 扫二维码继续学习 二维码时效为半小时

(0评价)
价格: 免费

1.Python有一个简单的字符串格式化方法,使用%做占位符,%后面跟变量。

2.%(占位符)

3./n(换行作用)

4.format

5.input(输入)

6.type(查询类型)

格式化符号:

1.%c

2.%s

3.%i

4.%d

5.%u

6.%o

7.%X

8.%e

9.%E

10.%f

11.%g

12.%G

 

[展开全文]

hist 直方图

from matplotlib import pyplot as plt

from matplotlib import font_manager

a=[zifuchuan]

plot.hist(a.fenzushu)

细节

计算组数=num_bin= (max(a)-nim(b)//d)

d=5

组数= 极差/组距

x轴的刻度设置

plt.xticks(range(min(a),max(a)+d,d))

plt.show()

图形大小:plt.figure(figsze=(20,8),dpi=80)

{数据}

 

 

 

[展开全文]

算术运算符

1.+(加法)

2.-(减法)

3.*(乘法)

4.**(指数)

5.%(取余)

6./(除法)

7.//(地板除)

比较运算符

1.==(等于)

2.!=(不等于)

3.>(大于)

4.<(小于)

5.>=(大于等于)

6.<=(小于等于)

[展开全文]

Python基本类型:

1.字符串

2.元组

3.字典

4.列表

数字:

5..int

6.long

7.float

8.布尔值

9.变量必须以字母或下划线开头

10.其他字符可以是字母,数字或__(下划线)

11.变量区分大小写

12.不能用关键字来做变量名

 

[展开全文]

1.变量=储存的数据。

2.变量不仅仅可以是数字,还可以是其他的任意类型。

3.我们可以通过定义变量来申请并命名这样的存储空间,并通过变量的名字来使用这段储存空间。

4.变量是程序中临时储存数据的场所。

 

[展开全文]

数组的形状

shape即可查看数组的各个维度长度(输出按三维二维依次降低,块、行、个)

reshape方法可以重新设置行列,是有返回值的,而不改变本身

有返回值才会输出

结合shape和reshape可以做到在不清楚维度长度的情况下降维

flatten可以将数组展开变成一维

 

数组的计算

numpy数组对数字进行+*-/计算,是对全部单元进行计算

nan>>not a number 0/0

inf>>infinite x/0

数组对数组进行计算:

不同维度的数组进行计算至少有一个维度的长度相同

广播会在缺失或者长度为1的维度上进行(不同维度的计算本质上是广播)

广播原则:如果两个数组的后缘维度,即从末尾开始算起的维度轴长相符,或者某一方的长度为1,即广播jian'r

[展开全文]
Flying_X · 2022-05-22 · 自由式学习 0

一维数组只有0轴,二维有0、1轴,三维有0、1、2轴

reshape(0,1,2),shape输出(2,1,0)

CSV逗号分隔值文件

numpy的读取文件方法

unpack参数实现行列转置

transpose,T,swapaxes(1,0)方法实现行列转置

[展开全文]
Flying_X · 2022-05-22 · 自由式学习 0

numpy的索引和切片

索引从0开始

2:取得连续多行,[[2,5,6]]多一个[]取得不连续的行

:,1取得单列

:,1:取得连续列

:,[]取得不连续列

取得行列交叉的内容

取得不相邻的点

[展开全文]
Flying_X · 2022-05-15 · 自由式学习 0

mysql数据查询

条件查询:

比较条件: > < = != <>   跟在where后面

in 查询 指定一个数据容器

between 表示一个区间  1到10  还可以表示时间范围

null值的判断 如果是一个空值对象的话 用is判断

如果是空字符串的话,则使用 = 判断

排序 order by  【asc升序 desc降序】可以指定多个字段排序;

 

聚合函数:

count()

max()

min()

length()

sum()

avg()

round()

date()

substr()   left right

分组和分页

分组 group by

as 取别名

分组条件的筛选 where having

where 跟在from后面

having跟在group by后面

limit分页 select * from student limit start(起始位置) count(读取数量)

连接查询

内连接:inner join 两种表共同的数据

左连接:left join 参考左边的表为基准查询表,右边的表用null填充;

右连接 right join 参考右边的表为基准查询表,左边的表用null填充

 

子查询

1、标量查询 一行一列查询 单个值

2、列级子查询 一行多列 多个值

3、行级子查询 多行一列

4、表级子查询 多行多列【用来做数据源】

保存查询结果:

insert into 表名 select 查询来充当数据源;

union去重输出

union all 输出多次查询的结果;

[展开全文]

这个老师的逻辑能力和语言组织能力真的是匮乏 前言不搭后语 自己把自己绕进去了

[展开全文]

这课程讲的就和拿着稿子照本宣科一样

[展开全文]

如果要计算某个维度下的用户数,不要直接count()

[展开全文]
2855Kevin · 2022-04-11 · 自由式学习 0

 #apply返回每个测试样本所在叶子节点的索引

clf.apply(xtext)

#predict返回每个测试样本的分类、回归结果

clf.predict(xtest)

[展开全文]
小王 · 2022-03-25 · 自由式学习 0
#决策树
# from sklearn import tree#导入需要的模块
# clf=tree.DecisionTreeClassifier()#实例化
# clf=clf.fit(x_train,y_train)#用训练集数据训练模型
# result=clf.score(x_test,y_test)#导入测试集,从接口中调用需要的信息进行打分

citerion:不纯度,不纯的越低,训练集拟合越好

 

[展开全文]
小王 · 2022-03-25 · 自由式学习 0

字符串及常用方法:

[展开全文]