dates=pd.date_range('20160301',periods=6)
创建二位数组
data=pd.DataFram(np.random.randn(6,4),index=dates,columns=list('ABCD')
用字典创建二位数组
d={'a':1,'b':pd.Timestamp('20130301'),'C':range(4),'D':np.arange(4)}
pd.DataFram(d)
怎么cha看数据
data.head()前5行
data.tail()后5行
data.tail(3)后3行
data.index行标签
data.columns列标签
data.values查看值
data.describe整体情况
data.T数据转置
对数居进行排序
根剧烈标签来排序
data.sort_index(axis=1)
排个降序
data.sort_index(axis=1,ascending=False)
行标签排序
data.sort_index(axis=0,ascending=False)
通过某一列的值进行排序
data.sort_values(by='A')
选中某个列
data['a']
data.a
选中几行
data[2:4]
通过标签进行选择
data['a','b']
通过标签函数进行选择
data.loc['a','b']
通过内置的标签选取索要的数据
data.iloc[2:4]
只选择出B和C 两列的数据
data.loc[:,['b','c']]
选取某个行区间内的某个列区间
data.loc['20160302':'20160305',['b','c']]
通过loc函数访问某个特定的值
data.loc['20160302','b']
data.at[pd.imestamp('20160302'),'b']
data.iloc[1]选出第一行的数据
data.loc[1:3]
也可以选择某列某行
data.iloc[1:3,2:4]
也可以选择某几列
data.iloc【:,1:3】
某个值
data.iloc[1,1]
data.iat[1,1]
查看运行效率
%timeit df.iloc[1,1]
使用布尔索引。
data[data>0]