玩一玩pandas--基础
1. 要用到的几个基本模块
import pandas as pd
from pandas import Series
from pandas import DataFrame
2. Series
Series是一种类似于一维数组的对象,由下面两个部分组成:
values : 一组数据(ndarray类型);
index : 相关的数据索引标签
2.1 两种创建方式
(1) 由列表或numpy数组创建(默认索引为0到N-1的整数型索引, 可重新修改)
(2) 由字典创建:不能在使用index.但是依然存在默认索引
2.2 Series的索引和切片
可以使用中括号取单个索引(此时返回的是元素类型),或者中括号里一个列表取多个索引(此时返回的是一个Series类型)
索引:
(1) 显示索引
- 使用index中的元素作为索引值(即自己制定的index,为显示索引)
- 使用s.loc[](推荐):注意,loc中括号中放置的一定是显示索引
(2) 隐式索引
- 使用整数作为索引值
- 使用 iloc[](推荐):注意,iloc中括号中放置的一定是隐式索引
切片
(1) 显示切片
(2) 隐式切片
2.3 给Series增加行
2.4 Series的一些属性
2.5 Series的常用方法
(1) 读取前N个
(2) 去重 (不改变原来的Series)
3. DataFrame