关于pandas的一些笔记
1 import pandas as pd 2 import numpy as np 3 4 df = pd.read_csv('./dogname/dogNames2.csv') 5 df = df.head(10) 6 print(df) 7 #print(df.loc[1, 'Row_Labels']) #取行索引为1,列索引为Row_Labels的数据 8 t1 = df.loc[[1,2],] #取第一行和第二行,等价于df.loc[[1,2],:] 9 t2 = df.loc[[1,2], ['Row_Labels','Count_AnimalName']] #取块 10 t3 = df.iloc[:,1] #取第一列的数据 11 t4 = df.iloc[[8,9], 1] #取第8行和第9行的第1列数据 12 t5 = df[(df['Count_AnimalName']>2)&(df['Count_AnimalName']<50)] #布尔值为索引 13 t6 = df[(df['Row_Labels'].str.len()>5)&(df['Count_AnimalName']>2)]#取Row_Labels字符串长度大于5且Count_AnimalName大于2的数据
pands取行或者列的注意点
1、方括号写数组,表示取行,对行进行操作 df[:20]
2、写字符串,表示的取列索引,对列进行操作 df['Row_Labels']
3、df[:100]['Row_Labels']表示先取前100行,再去Row_Labels这列的元素
4、df.loc通过行标签取行数据,df.iloc通过行索引获取行数据。标签和索引有区别,索引只能为数字(0,1,2,3...),标签可以为任意(例如:a,b,c,d...)
--------------------成功,肯定是需要一点一滴积累的--------------------