关于pandas的一些笔记

 1 import pandas as pd
 2 import numpy as np
 3 
 4 df = pd.read_csv('./dogname/dogNames2.csv')
 5 df = df.head(10)
 6 print(df)
 7 #print(df.loc[1, 'Row_Labels']) #取行索引为1，列索引为Row_Labels的数据
 8 t1 = df.loc[[1,2],]  #取第一行和第二行，等价于df.loc[[1,2],:]
 9 t2 = df.loc[[1,2], ['Row_Labels','Count_AnimalName']] #取块
10 t3 = df.iloc[:,1]         #取第一列的数据
11 t4 = df.iloc[[8,9], 1]   #取第8行和第9行的第1列数据
12 t5 = df[(df['Count_AnimalName']>2)&(df['Count_AnimalName']<50)] #布尔值为索引
13 t6 = df[(df['Row_Labels'].str.len()>5)&(df['Count_AnimalName']>2)]#取Row_Labels字符串长度大于5且Count_AnimalName大于2的数据

pands取行或者列的注意点
1、方括号写数组，表示取行，对行进行操作 df[:20]
2、写字符串，表示的取列索引，对列进行操作 df['Row_Labels']
3、df[:100]['Row_Labels']表示先取前100行，再去Row_Labels这列的元素
4、df.loc通过行标签取行数据，df.iloc通过行索引获取行数据。标签和索引有区别，索引只能为数字（0，1，2，3...），标签可以为任意（例如：a,b,c,d...）

posted @ 2020-03-30 16:13 牛公的跑奔阅读(182) 评论(0) 收藏举报

刷新页面返回顶部

牛公的跑奔

罗马不是一天建成的，但一定是一天一天建成的。

关于pandas的一些笔记

公告