2891-房同学-Python学科-就业：否 - 拜师教育 - 师徒制教育平台|人工智能培训|大数据培训|JAVA培训|PYTHON培训| - Powered By EduSoho

2891-房同学-Python学科-就业：否

2891-房同学-Python学科-就业：否 2891-房同学-Python学科-就业：否扫二维码继续学习二维码时效为半小时

(0评价)

价格：免费

班级有效天数：366天

学员(1)
课程(17)
分享

承诺服务

练
试
问
疑
动
业

排序：最新笔记
- 最新笔记
- 点赞最多

matplotlib

1808_Y_王佳莉 · 2021-06-02 · 解锁式学习 0

plt.figure(figsize=(20,8),dpi=80)

plt.savefig('./sig.png')

plt.xticks(x) #x的每个值

plt.xticks((1,26))#调整步长

1808_Y_王佳莉 · 2021-06-02 · 解锁式学习 0

matplotlib

1.什么是matplotlib

主要做数据可视化，模仿matlab

安装conda install matplotlib

2.matplotlib基本要点

axis轴，指的是x或y轴

from matplotlib import pyplot as plt

x= range(2,26,2)

y=[15,13,14.5,17,20,25,26,26,24,22,18,15]

plt.plot(x,y)

plt.show()

1808_Y_王佳莉 · 2021-06-02 · 解锁式学习 0

提出问题

准备数据（数据清洗）

分析数据

获得结论

成果可视化

1808_Y_王佳莉 · 2021-06-02 · 解锁式学习 0

pandas时间序列

现在我们有2015到2017年25万条911的紧急电话的数据，请统计出出这些数据中不同类型的紧急情况的次数，如果我们还想统计出不同月份不同类型紧急电话的次数的变化情况，应该怎么做呢？

为什么要学习pandas的时间序列

不管在什么行业，时间序列都是一种非常重要的数据形式，很多统计数据以及数据的规律也都和时间序列有着非常重要的联系

时间格式化

python中时间日期格式化符号：
%y 两位数的年份表示（00-99）
%Y 四位数的年份表示（000-9999）
%m 月份（01-12）
%d 月内中的一天（0-31）
%H 24小时制小时数（0-23）
%I 12小时制小时数（01-12）
%M 分钟数（00=59）
%S 秒（00-59）
%a 本地简化星期名称
%A 本地完整星期名称
%b 本地简化的月份名称
%B 本地完整的月份名称
%c 本地相应的日期表示和时间表示
%j 年内的一天（001-366）
%p 本地A.M.或P.M.的等价符
%U 一年中的星期数（00-53）星期天为星期的开始
%w 星期（0-6），星期天为星期的开始
%W 一年中的星期数（00-53）星期一为星期的开始
%x 本地相应的日期表示
%X 本地相应的时间表示
%Z 当前时区的名称
%% %号本身

1512_N_小星星 · 2021-05-13 · 解锁式学习 0

pandas数据重采样

指的是将时间序列从一个频率转化为另一个另一个频率进行处理的过程，将高频率数据转化为低频率为降采样，低频率转化为高频率为升采样

1512_N_小星星 · 2021-05-13 · 解锁式学习 0

关于索引和复合索引

1512_N_小星星 · 2021-05-12 · 解锁式学习 0

merge——进行列合并，合并的是相同索引值得列默认的方式是inner，取交集，当没有相同的数的时候取空

1512_N_小星星 · 2021-05-12 · 解锁式学习 0

思考：对于一组电影数据，如果要对这些数据进行分类，应该如何操作？

首先，先构一个二维数组，行数等于gener_list的数据量，即取出来genre这一列的数据，通过逗号进行分割，即将每一行数据分割出来一二维数据的形式返回列表中

df["Genre"].str.split(",").tolist()

然后将这个list里面的数据都转换为一维数组且去重

再构建一个新的二维数组，最初的值都为零，行是genre 的数据量，列表是一维数组的数据量，分类最为列索引

1512_N_小星星 · 2021-05-08 · 解锁式学习 0

字符串的方法

1512_N_小星星 · 2021-05-07 · 解锁式学习 0

pandas里面计算mean（）时，可以直接跳过nan，来返回其他值得平均数

1512_N_小星星 · 2021-05-07 · 解锁式学习 0

#显示所有列
pd.set_option('display.max_columns', None)
#显示所有行
pd.set_option('display.max_rows', None)

1757_N_DZ · 2021-05-06 · 解锁式学习 0

pandas的索引

1.df.loc 通过标签索引行数据

2.df.iloc 通过位置获取行数据

1512_N_小星星 · 2021-05-06 · 解锁式学习 0

DataFrame的基本属性

1512_N_小星星 · 2021-05-06 · 解锁式学习 0

为什么要学习pandas？

numpy处理数值型数据；pandas用来处理字符串和时间序列等

pandas的常用数据类型

（1）series——一维、带标签的数组

（2）DataFrame——二维数组

1512_N_小星星 · 2021-05-06 · 解锁式学习 0

生成随机数的方法

1512_N_小星星 · 2021-05-05 · 解锁式学习 0

ndarray缺失值填充均值

1512_N_小星星 · 2021-05-02 · 解锁式学习 0

numpy 中的nan 和 inf

nan：not a number表示不是一个数字

当我们读取本地的文件为float时，如果有缺失，就会出现nan，当做了一个不合适的计算的时候也会出现nan（比如无穷大inf减去无穷大）

特殊属性：（1）两个nan是不相等的；（2）np.nan != np.nan;（3）利用以上特性，判断数组中nan的个数；（4）通过np.isnan（t）来判断nan有几个；（5）nan跟任何一个数进行计算都是nan

在一组数据中单纯将nan替换为0并不合适，很多时候会把缺失值替换成均值（中值）或者直接删除有缺失值的一行。

求和：t.sum(axis=None)

均值：t.mean(axis=None) 受离群点的影响较大

中值：np.median(t,axis=None)

最大值：t.max(axis=None)

最小值：t.min(axis=None)

极值：np.ptp(t,axis=None) 即最大值和最小值只差

标准差：t.std(axis=None)

inf：表示真无穷；-inf表示负无穷

什么时候出现inf或-inf？比如一个数字除以0

1512_N_小星星 · 2021-05-02 · 解锁式学习 0

numpy中数值的修改

numpy中布尔索引

numpy中三元运算符

numpy中的clip（裁剪）

1512_N_小星星 · 2021-05-02 · 解锁式学习 0

numpy索引和切片

1512_N_小星星 · 2021-05-01 · 解锁式学习 0

班主任

该定制计划尚未设置班主任

新加学员

学员动态

2417aeb1529c3e26 开始学习 097 1-2-MySQL优化...

2417aeb1529c3e26 完成了 096 1-1-MySQL优化...

2417aeb1529c3e26 开始学习 096 1-1-MySQL优化...

2417aeb1529c3e26 加入学习