数据格式化汇总
数值格式化
1.1 设置小数点位数
df['column_name'] = df['column_name'].round(2) # 保留两位小数
1.2 使用 apply 自定义格式化
df['column_name'] = df['column_name'].apply(lambda x: '{:,.2f}'.format(x)) # 逗号分隔符
1.3 格式化为百分比
df['column_name'] = df['column_name'].apply(lambda x: '{:.2%}'.format(x)) # 百分比格式
1.4 使用 pd.options
设置全局格式
pd.set_option('display.float_format', lambda x: '%.2f' % x) # 全局保留两位小数
1.5 使用 style.format
进行格式化
df.style.format({'column_name': '{:.2f}'}) # 显示时保留两位小数
1.6 禁用科学计数法
pd.set_option('display.float_format', '{:.2f}'.format) # 禁用科学计数法
1.7 分组后聚合的格式化
grouped = df.groupby('category')['value'].mean() formatted_grouped = grouped.apply(lambda x: '{:.2f}'.format(x)) # 聚合结果保留两位小数
1.8 自定义格式
df['column_name'] = df['column_name'].apply(lambda x: f'${x:,.2f}') # 货币格式
1.9 使用 numpy
进行格式化
import numpy as np df['column_name'] = np.where(df['column_name'] > 0, df['column_name'], 0) # 将负值替换为0