第四课: - 添加/删除列 - 索引操作
第 4 课
在本课中,我们将回到基础知识。我们将使用一个小的数据集,以便您可以轻松理解我想要解释的内容。我们将添加列,删除列,并以许多不同的方式切分数据。Enjoy!
In [1]:
# Import libraries
import pandas as pd
import sys
In [2]:
print('Python version ' + sys.version)
print('Pandas version: ' + pd.__version__)
In [3]:
# Our small data set
d = [0,1,2,3,4,5,6,7,8,9]
# Create dataframe
df = pd.DataFrame(d)
df
Out[3]:
In [4]:
#改变df 列的名字
df.columns = ['Rev']
df
Out[4]:
In [5]:
# 添加一列
df['NewCol'] = 5
df
Out[5]:
In [6]:
# 修改列
df['NewCol'] = df['NewCol'] + 1
df
Out[6]:
In [7]:
# 删除列
del df['NewCol']
df
Out[7]:
In [8]:
# 添加几列
df['test'] = 3
df['col'] = df['Rev']
df
Out[8]:
In [9]:
#如果我们想要,我们甚至可以改变索引的名称
i = ['a','b','c','d','e','f','g','h','i','j']
df.index = i
df
Out[9]:
现在我们可以开始使用loc选择数据帧的各个部分。
In [10]:
df.loc['a']
Out[10]:
In [11]:
# df.loc[inclusive:inclusive]
df.loc['a':'d']
Out[11]:
In [12]:
# df.iloc[inclusive:exclusive]
# 注意:.iloc基于严格的整数位置[版本0.11.0以上]
df.iloc[0:3]
Out[12]:
我们也可以使用列名选择。
In [13]:
df['Rev']
Out[13]:
In [14]:
df[['Rev', 'test']]
Out[14]:
In [15]:
# df.ix[rows,columns]
# 代替已弃用的ix函数
#df.ix[0:3,'Rev']
df.loc[df.index[0:3],'Rev']
Out[15]:
In [16]:
#
代替已弃用的ix函数
#df.ix[5:,'col']
df.loc[df.index[5:],'col']
Out[16]:
In [17]:
#
代替已弃用的ix函数
#df.ix[:3,['col', 'test']]
df.loc[df.index[:3],['col', 'test']]
Out[17]:
还有一些方便的功能可以选择数据帧的顶部和底部记录。
In [18]:
# Select top N number of records
df.head(5)
Out[18]:
In [19]:
# Select bottom N number of records
df.tail(5)
Out[19]: