python pandas字符处理一
s = pd.Series(['lower', 'CAPITALS', 'this is a sentence', 'SwApCaSe']) s.str.lower() # 转为小写 s.str.upper() # 转为大写 s.str.title() # 标题格式,每个单词大写 s.str.capitalize() # 首字母大写 s.str.swapcase() # 大小写互换 s.str.casefold() # 转为小写,支持其他语言(如德语)
# 居中对齐,宽度为10,用'-'填充 s.str.center(10, fillchar='-') # 左对齐 s.str.ljust(10, fillchar='-') # 右对齐 s.str.rjust(10, fillchar='-') # 指定宽度,填充内容对齐方式,填充内容 # 参数side可取值为left、right或both}, 默认值为left s.str.pad(width=10, side='left', fillchar='-') # 填充对齐 s.str.zfill(3) # 生成字符,不足3位的在前面加0
以下是文本的计数和内容编码方法: # 字符串中指定字母的数量 s.str.count('a') # 字符串长度 s.str.len() # 编码 s.str.encode('utf-8') # 解码 s.str.decode('utf-8') # 字符串的Unicode普通格式 # form{'NFC', 'NFKC', 'NFD', 'NFKD'} s.str.normalize('NFC')
与文本格式相关的判断: s.str.isalpha # 是否为字母 s.str.isnumeric # 是否为数字0~9 s.str.isalnum # 是否由字母或数字组成 s.str.isdigit # 是否为数字 s.str.isdecimal # 是否为小数 s.str.isspace # 是否为空格 s.str.islower # 是否小写 s.str.isupper # 是否大写 s.str.istitle # 是否标题格式