07. Matplotlib 3 |表格样式| 显示控制
1.表格样式创建
表格视觉样式:Dataframe.style → 返回pandas.Styler对象的属性,具有格式化和显示Dataframe的有用方法
样式创建:
① Styler.applymap:elementwise → 按元素方式处理Dataframe
② Styler.apply:column- / row- / table-wise → 按行/列处理Dataframe
import numpy as np import pandas as pd import matplotlib.pyplot as plt % matplotlib inline
#样式 df = pd.DataFrame(np.random.randn(10, 4), columns=['a','b','c','d']) sty = df.style print(sty, type(sty)) # 查看样式类型 sty # 显示样式
---->
<pandas.formats.style.Styler object at 0x00000000097731D0> <class 'pandas.formats.style.Styler'>
按元素处理样式 df.style.applymap( 函数 )
# 按元素处理样式:style.applymap() def color_neg_red(val): if val < 0: color = 'red' else: color = 'black' return ('color:%s'% color) df.style.applymap(color_neg_red) # 创建样式方法,使得小于0的数变成红色 # style.applymap() → 自动调用其中的函数
按行/列处理样式 df.style.apply( 函数, axis=0按列, subset=['b','c']处理b、c列 )
# 按行/列处理样式:style.apply() def highlight_max(s): is_max = s == s.max() print(is_max) lst = [] for v in is_max: if v: lst.append('background-color: yellow') else: lst.append('') return (lst) df.style.apply(highlight_max, axis=0, subset=['b', 'c']) # axis:0为列,1为行,默认为0; # subset:索引 # 创建样式方法,每列最大值填充黄色
0 False 1 False 2 True 3 False 4 False 5 False 6 False 7 False 8 False 9 False Name: b, dtype: bool 0 False 1 False 2 True 3 False 4 False 5 False 6 False 7 False 8 False 9 False Name: b, dtype: bool 0 False 1 False 2 False 3 True 4 False 5 False 6 False 7 False 8 False 9 False Name: c, dtype: bool
样式索引、切片
df.style.apply(highlight_max, axis = 1,
subset = pd.IndexSlice[2:5,['b', 'd']]) 按照index索引,再切片b、d列所对应的值
# 样式索引、切片 df.style.apply(highlight_max, axis = 1, subset = pd.IndexSlice[2:5,['b', 'd']]) # 通过pd.IndexSlice[]调用切片 # 也可:df[2:5].style.apply(highlight_max, subset = ['b', 'd']) → 先索引行再做样式
b True d False Name: 2, dtype: bool b True d False Name: 2, dtype: bool b False d True Name: 3, dtype: bool b True d False Name: 4, dtype: bool b False d True Name: 5, dtype: bool
2.表格显示控制
df.head().style.format("{:.2%}")
# 按照百分数显示 df = pd.DataFrame(np.random.randn(10,4),columns=['a','b','c','d']) print(df.head()) df.head().style.format("{:.2%}")
a b c d
0 1.239244 0.018364 0.570776 0.087462
1 -0.340928 -0.217569 -0.532815 -1.535981
2 -0.647936 -1.520526 -1.937499 -0.257186
3 -0.887309 1.037361 0.084524 0.187425
4 1.821439 -0.728899 0.191298 0.016149
df.head().style.format("{:.4f}")
# 显示小数点数 df.head().style.format("{:.4f}")
df.head().style.format("{:+.2f}")
# 显示正负数 df.head().style.format("{:+.2f}")
df.head().style.format({'b':"{:.2%}", 'c':"{:+.3f}", 'd':"{:.3f}"})
# 分列显示 df.head().style.format({'b':"{:.2%}", 'c':"{:+.3f}", 'd':"{:.3f}"})
3.表格样式调用
Styler内置样式调用
df.style.highlight_null(null_color='red') #定位空值
# 定位空值
df = pd.DataFrame(np.random.rand(5, 4), columns=list('ABCD')) df['A'][2] = np.nan df.style.highlight_null(null_color='red')
df.style.background_gradient(cmap='Greens',axis =1,low=0,high=1) 色彩映射
# 色彩映射 df = pd.DataFrame(np.random.rand(10,4),columns = list('ABCD')) df.style.background_gradient(cmap='Greens',axis =1,low=0,high=1) # cmap:颜色; # axis:映射参考,0为行,1以列
df.style.bar(subset=['A', 'B'], color='#d65f5f', width=100)
# 条形图 df = pd.DataFrame(np.random.rand(10,4),columns = list('ABCD')) df.style.bar(subset=['A', 'B'], color='#d65f5f', width=100) # width:最长长度在格子的占比
# 分段式构建样式 df = pd.DataFrame(np.random.rand(10,4),columns = list('ABCD')) df['A'][[3,2]] = np.nan df.style.\ bar(subset=['A', 'B'], color='#d65f5f', width=100).\ highlight_null(null_color='yellow')