点开,看一段,你就会喜欢上学习pandas,你该这么学!No.3
身为一个啰嗦的博主,还是要说点啥,如果你不想学,直接拖拽到最后,发现彩蛋,然后3秒
我呢,有个小目标,就是把技术类的文章,写的有趣
编程呢,最难的是什么?
我投票给入门
其实,把一个人带进编程的大门是最难的
而梦想橡皮擦这位大佬,就在做这个事情
(说白了,就是高深的文章写不出来,还要装做大佬,心好累,好不容易找到这么一个借口,真开心)
我要通过一个系列的pandas文章
让你学会这一个简简单单的模块
然后还能顺便写点好玩的东东
美哉~
每篇文章,让你阅读起来如丝般顺滑
继续pandas,series函数的学习
上篇博客,咱们就稍微了解了一丢丢series的函数
远远不够的
这篇呢,我们继续
心里默念
pandas是处理数据的,是处理数的,数字的
OK,GET到这个就好多了
后面我就好编了
import pandas as pd
s = pd.Series([3,1,4,1,5,9,2,6,8,3,6])
print(s)
我创建了一个基本的Series,然后要对它进行处理了
对一个线性的数据来说
我们可以干很多事情
比如,我要获取最大最小值
import pandas as pd
s = pd.Series([3,1,4,1,5,9,2,6,8,3,6])
print(s.min())
print(s.max())
这个写法还是太简单了,显示不出来我们学到东西了
咱弄点新鲜的(其实就是官网比较复杂的例子)
先给series创建一个带有层次的索引
带有层次的索引,啥意思?
其实就是excel里面的合并单元格
看代码
idx = pd.MultiIndex.from_arrays([
['warm', 'warm', 'cold', 'cold'],
['dog', 'falcon', 'fish', 'spider']]
,names=['blooded', 'animal'])
s = pd.Series([4, 2, 0, 8], name='legs', index=idx)
print(s)
一个关于冷血动物和温血动物关于有多少足的表格
唉,好长一段文字,输出长这个样子
看不明白,没关系,放到excel里面瞅瞅
咋么样,小版一排,清晰明了
就一个表格
当前前面依旧是index
真正的数据就后面那一列
然后,操作一番
idx = pd.MultiIndex.from_arrays([
['warm', 'warm','warm', 'cold', 'cold'],
['dog', 'falcon','people', 'fish', 'spider']]
,names=['blooded', 'animal'])
s = pd.Series([4, 2,2, 0, 8], name='legs', index=idx)
print(s)
print(s.min())
print(s.max(level='blooded'))
后面的level就是控制多索引的哦~
看到结果,你可以秒懂吗?
s = pd.Series([4, 2,2, 0, 8], name='legs', index=idx)
print(s)
print(s.min()) # 输出0
print(s.max(level='blooded')) # 输出 下面的表格
没错,我是下面的表格
学会了吧,这个学会了,min,max,sum,idxmin,idxmax你应该都会了
什么idx是啥?看看上面的代码
那个是索引... ...
还要啰嗦一个属性
对于series来说,还有一个属性非常,非常重要,重要到使用之后,没啥效果?
这个属性就是T
没错,一个大写的字母T
哈哈哈,其实这个属性对于series来说,基本没啥用
使用之后还是等于自己本身
s = pd.Series([3,1,4],index=['a','b','c'])
print(s)
print(s.T)
继续看函数
好像跑偏了,怎么看到属性去了
继续看函数啊
一个线性杂乱的数据,对于我们来说
还可以排序啊
import pandas as pd
s = pd.Series([3,1,4,1,5,9,2,6,8,3,6])
既然排序了,你一猜,就能猜到(其实一般人根本猜不到,也就老师觉得你能猜到)
一个是按照值排序,一个是按照索引排序
import pandas as pd
s = pd.Series([3,1,4,1,5,9,2,6,8,3,6])
print(s.sort_values())
print(s.sort_index())
排序的一些参数,可以屡屡
Series.sort_values(axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last')
- axis 按照哪个参考轴排序. 对于 Series来说,只能设置为0
- ascending 倒序还是正序 True升序
- inplace 默认false,修改为true,原地修改?咦,不明白吧,一会我给你举个栗子
- kind 排序方法 快速排序,归并排序,堆排序
- na_position 空值,在前还是在后,这个,你试一下就知道了
inplace
看一下下面的代码,原地替换
s = pd.Series([3,1,4,1,5,9,2,6,8,3,6])
sorted_s = s.sort_values(inplace=True)
print(sorted_s)
这时候打印出来的是None,但是你打印s,就能出现排序之后的文字
明白了没?
就是把s变量直接给排序了
排序搞定之后,就要尝试获取series中的部分内容
获取头部几条
头部头部head
获取末尾几条
tail,tail
import pandas as pd
s = pd.Series([3,1,4,1,5,9,2,6,8,3,6])
print(s.head(2))
print(s.tail(2))
获取部分数据可以,那么肯定也可以删除数据喽
(我顺口说的)
Series.drop
import pandas as pd
s = pd.Series([3,1,4,1,5,9,2,6,8,3,6])
print(s.drop(labels=[0,1]))
对于series来说,labels参数是必备的
为什么呢?因为其它的压根不支持
新版本的可以用index替换labels
好了,又学到新知识点了吧
不多不少,几个正好
每日学一点吧,啊
明天写点啥,可能是DataFrame吧
最后,欢迎关注一个唠叨的编程工程师的公号,非本科程序员
掏出你的手机,拍这个