numpy多用在大型、多维数组上执行数值运算;
numpy多用在大型、多维数组上执行数值运算;
a = [1,2,3,4,4,4,4]
命名规则:1.可以以字母(大小写)、数字、下划线命名,但不能以数字开头。
2.另需区分大小写。
3.关键字不能用作变量名。
命名规范;
1.见名知意
2.小驼峰,第一个词的首字母小写,其余单词的手写是大写
3.大驼峰,全部单词首字母大写。
3.每个单词的中间加下划线
4.赋值的时候,若是文本形式则家'',若是数字则bu'yon
折线图:能够显示数据的变化趋势,反应事物的变化情况(变化)
直方图:绘制连续性的数据,展示一组或多组数据的分布情况(统计)
条形图:绘制离散的数据,能够一眼看出各个数据的大小,比较数据之间的差别(统计)
散点图:判断变量之间是否存在数量关联趋势,展示离群点(分布规律)
1.变量:顾名思义可以变化的,相当于一个容器,可以装任何东西,比如苹果。装好后,容器和其他东西结合的时候就会属于苹果。当变量不同时,其结果就不同。
2.变量+逻辑->python解释器-->软件的功能
3.在计算机语言中,变量=存储的数据
1.加注释的目的:为了便于二次修改和理解,注释前面加#(快捷键ctrl+/)即可。
2.如何进行多行注释:''' 或者"""
例:
'''
此处为注释内容,可编辑大量的内容
'''
此处为可运行的代码
1.优点:a.简单、易学;b.免费、开源,任何人都可以去下载阅读及修改,使之变得更强大。c.拥有更丰富的第三方库(不太明白第三方库是什么意思?)。d.可以移植,一次python的代码编写就可以在不同的平台上运行,仅需要下载不同的解释器就行。e.面向对象
2.缺点:a.运行速度慢:因为cpu需要一条一条去翻译。b.代码不能加密,需发源代码。但没人有时间去破解,因此关系不大。c.一个强制缩紧。d.有GIL全局解释器锁:虽然有多个线程,但因为有全局解释器锁,因此还是只能一个线程进行翻译。但几乎感觉不到GIL的存在,可忽略。
1.面向对象:
2.解释型:a.计算机语言是一种机器语言(二进制代码),没法直接识别python提供的语言。因此需要一个翻译的角色将python的代码翻译成机器语言,解释器运作的过程就是翻译的过程。翻译好后,交给计算机的CPU进行执行。
3.胶水:可以做到其他语言能做的事情,且做得更好。
metaver:v
matplotlib
from matplotlib import pyplot as plt(命名为plt简写)
数据分析的介绍
切片和索引
1.选择行 t【2】
2.选择列t【3:,:】
3.选择行列 连续的多行 t[2:,:3]
4.索引 t【2,3】
### numpy中的nan和inf
1.当本地文件为float的时候,有缺失时,会出现nan
或者做义工不适合的计算时
2.inf表示正无穷,-inf是负无穷
### numpy常用统计函数
1.求和:np.sum(t3,axis=0)是计算行上的结果
(axis=1是计算列上的结果)
2.均值:np.mean(t,axis=0)
3.中值:np.median(t3,axis=0)
4.最大值:np.max(axis=0)
5.最小值:np.min(axis=0)
6.极值:np.ptp(t3,axis=0)
7.标准差:np.std(axis=0)
标准差反应数据的波动情况,越大则越分散
## numpy好用的方法
1.获得最大值最小值的位置
np.argmax(t,axis=0)
np.argmin(t.axis=1)
2.创建一个全为0的数组:np.zeros((3,4))
3.创建一个全为1的数组:np.ones((3,4))
4.创建一个对角线为1的正方形数组(方阵):
np,eye(3)
## numpy生成随机数
##数组的拼接
#竖直拼接
np.vstack((t1,t2))
#水平拼接
np.hstack((t1,t2))
#行交换
t[[1,2],:]=t[[2,1],:]
#列交换
t[:,[0,2]]=t[:,[2,0]]
np.where(t<10,0,10)#numpy三元运算符
如果t<10,则为0,否则为10
np.clip(10,18)#numpy的裁剪