2.7 毕业设计
1.pandas
类似于字典形式的numpy
s = pd.Series([1,3,6,np.nan,44,1]) s 0 1.0 1 3.0 2 6.0 ...
#创建dataframe dates = pd.date_range('20160101',periods=6) df = pd.DateFrame(np.random.randn(6,4),index = dates,columns=[a,b,c,d]) #数据是第一个 index是行 columns是列
df1 = pd.DataFrame(np.arange(12).reshape(3,4)) df1 0 1 2 3 0 0 1 2 3 1 4 5 6 7 2 8 9 10 11 df2 = pd.DataFrame({'A:1}, 'B':pd.asdas, 'C':asdsad}) #A代表行的0 B行的代表1 df2.dtypes #反映出维度 #以及类型 df2.index #输出所有列的标记 0 1 2 3 df2.columns df2.values #输出array df2.describe() #计算平均值方差最小值最大值等等 df2.T #当作矩阵来看 #行变成列,列变成行 df.sort_index(axis=1,ascending=False) #1对行排序 0对列排序 倒序 df2.sort_values(by='E') #指定哪一列排序内部排序
莫烦python P15
存储或调用数据
data = pd.read_csv('asd.csv') #自动加一个索引 #存储 data.to_pickle('student.pickle')
1、是否保留列名 header: Whether to write out the column names (default True)
df.to_csv(‘path/Result.csv’,header=0) #不保存列名
2、是否保留行索引 index: whether to write row (index) names (default True)
df.to_csv(‘path/Result1.csv’,index=0) #不保存行索引
3、读取csv
test=pd.read_csv(“path/xxx.csv”)