python pandas df.quantile 计算样本的分位数


import pandas as pd
import numpy as np

def
quantile_test(): """ 计算样本的分位数(0到1) Return value at the given quantile. 计算的时候总共分3步, 1.对要计算的一组数据进行从小到大的排列 2.4个元素的数据,将其相邻的两个元素搭配,可分成3组 fraction = 3 * 计算样本的分位数(0到1) 3. 根据fraction 判断是哪组数据0-1是第一组。1到2是第二组...... 4. linear: i + (j - i) * fraction lower: i. 这组数据中的小值 higher: j. 这组数据中的大值,fraction 是第三步中的小数部分,意思是当前这组数据的0到1的分位数 """ df = pd.DataFrame(np.array([[1, 1], [2, 100], [3, 10], [4, 100]]), columns=['a', 'b']) print(df) print("-----计算样本的分位数------") print(df.quantile([.1, .2, .3, .4, .5, .6, .7, .8], numeric_only=True)) if __name__ == '__main__': quantile_test()
返回结果:
   a    b
0  1    1
1  2  100
2  3   10
3  4  100
-----计算样本的分位数------
       a      b
0.1  1.3    3.7
0.2  1.6    6.4
0.3  1.9    9.1
0.4  2.2   28.0
0.5  2.5   55.0
0.6  2.8   82.0
0.7  3.1  100.0
0.8  3.4  100.0

 

posted @ 2020-06-14 14:01  乘风去破浪  阅读(15622)  评论(0编辑  收藏  举报