学习参考:
日月光华 ------------python 数据分析 深度学习
此文章主要目的不是供人参考学习,是为了记录增强记忆,如要学习建议寻找上述学习参考;
pandas数据结构通常使用两种:
Series于DataFrame
感觉就是Series就是一个map的感觉,可以自定义键(index)进行索引,注意书写格式就是了,打印出来的格式在上图也可以看见,按照列打印,但是数据是一一对应的。
DataFrame就是将一堆数据组成表格进行查看,这种感觉有点像sql,但是比那个好看太多,也是注意格式,打印出来分为行索引,列索引
下面是一些pandas中这两个数据结构的使用方式代码:
Series:
对于Series可以直接放入数组数据value,如果在后面增加不加键index,index会默认按照数字排序,就是相当于数组了:
对于单独查询它的键或者数据也很简单
下面是一个Series自定义键index的创建格式以及其使用方式:
可以直接在索引的地方根据它的值范围索引,语言简单到不敢写:
s1[s1<3]查询的内容都是值<3的列表
下图是查询相应的列是否存在列表之中:
感觉这库的语言太语言化了
Series也可以使用字典的方式去创建:
它的创建虽然有默认的,但是如果你设定了键,就是以键为主,只显示你设置的键,对于你前面的设置是忽略的:
可以使用isnull函数查看无值的数据:
对于两个Series相加结果会出现如下:理解记忆就好,出现的键是并集,但是有值的键只有两Series的交集;
存在isnull函数也就存在notnull函数,isnull函数是显示series中不存在值的数据,但是notnull是对这些显示判断是不是存在值:
其使用的方式就与数组与图相似直接按键索引调用即可: