python数据分析学习(4)pandas基本功能二

4.整数索引
5.数据对齐
6.函数应用和映射
7.排序和命名
8.含有重复标签的轴索引

上节介绍了一些索引的选择，下面介绍另外一种选择数据的方式是使用loc和iloc选择数据。这两个分别叫做轴标签(loc)或整数标签(iloc)。

轴标签是通过索引或者列名选择数据。

整数标签是所在位置整数选择数据。

loc和iloc还可以带切片操作。

例如：

4.整数索引

在pandas中使用整数索引可能会产生歧义，尤其是当索引或者列名是整数的时候。想要推断用户所需要的索引方式是很难的。因此此时的轴标签(loc)或整数标签(iloc)就起到了作用了。

5.数据对齐

pandas的一个重要特性是不同索引的对象之间的算术行为。比如相加时，返回的结果的索引将是索引对的并集。没有交集的标签位置，数据对齐会产生缺失值。

例如：

将两个行或列完全不同的DataFrame对象相加，结果将全部为空。

例如：

可以在有缺失值的时候将缺失值填充为想要的数值，用fill_value方法。

例如：

可以用rdiv(n)将数组进行反转，比如将n/df和df.rdiv(n)等价反转。

例如：

6.函数应用和映射

NumPy的通用函数（逐元素数组方法）对pandas对象也有效，这里不详细介绍了。

还有一个常用的操作是将函数应用到一行或一列的一维数组上。可以用apply方法来实现这个功能，如果传递axis='columns'给apply函数，将会被每行调用一次，但是apply构建的一些常用函数可以用DataFrame的方法代替。

例如：