字符串格式化
在编写程序中经常需要动态输出字符串。例如,我们通过程序计算计算机的内存利用率,然后输出
10:15 计算机的内存利用率为30%
其中下划线部分的内容会动态调整,需要根据执行结果进行填充,最终形成上述格式的字符串输出。
这种功能就需要使用到字符串格式化操作,python中支持三种形式的字符串格式化:
%
字符串格式化format
方法字符串格式化f
表达式
%
字符串格式化
%
字符串格式化继承自C语言,其语法为:
格式字符串 % (值1,值2,...)
其中格式字符串中会使用%类型符号
作为需要被替换的槽位。例如:
>>> '%s计算机的内存利用率为%s%%' % ('11:15',75)
'11:15计算机的内存利用率为75%'
字符串'11.15'
会替换格式字符串中的第一个槽位%s
,整数75
会替换格式字符串中的第二个槽位%s
,因为%
是槽位标志,如果要输出%
本身需要通过它自己进行转义,所以格式字符串中最后是%%
,会输出%
。
注意需要替换的值要和格式字符串中的槽位数量一一对应,多了少了都会报错。
你以为这就完了吗?
槽位的完整格式为:
%[(name)][flags][width][.precision]typecode
可以实现很多很强大的功能,具体选项和功能如下:
-
(name)
可选,用于选择指定的key
-
flags
可选,可供选择的值有,注意只有在和数值类型的typecode
配合才起作用+
, 右对齐,正数前加正号,负数前加负号-
, 左对齐,正数前无符号,负数前加负号空格
, 右对齐,正数前加空格,负数前加负号0
, 右对齐,正数前无符号,复数前加负号;用0
填充空白处
-
width
,可选字符串输出宽度 -
.precision
可选,小数点后保留位数,注意只有在和数值类型的typecode
配合才起作用 -
typecode
必选s
,获取传入对象的字符串形式,并将其格式化到指定位置r
,获取传入对象的__repr__
方法的返回值,并将其格式化到指定位置c
,整数:将数字转换成其unicode对应的值,10进制范围为 0 <= i <= 1114111(py27则只支持0-255);字符:将字符添加到指定位置o
,将整数转换成 八 进制表示,并将其格式化到指定位置x
,将整数转换成十六进制表示,并将其格式化到指定位置d
,将整数、浮点数转换成 十 进制表示,并将其格式化到指定位置e
,将整数、浮点数转换成科学计数法,并将其格式化到指定位置(小写e)E
,将整数、浮点数转换成科学计数法,并将其格式化到指定位置(大写E)f
, 将整数、浮点数转换成浮点数表示,并将其格式化到指定位置(默认保留小数点后6位)F
,同上g
,自动调整将整数、浮点数转换成 浮点型或科学计数法表示(超过6位数用科学计数法),并将其格式化到指定位置(如果是科学计数则是e;)`G
,自动调整将整数、浮点数转换成 浮点型或科学计数法表示(超过6位数用科学计数法),并将其格式化到指定位置(如果是科学计数则是E;)`- %,当字符串中存在格式化标志时,需要用 %%表示一个百分号
是不是看着头皮发麻,不用死记硬背,常用功能就那么几个,多练习几遍自然就记住了。
一般情况下%
运算符后面的值与槽位按位置一一对应,但如果%
运算符后面接字典数据类型时,就需要通过(name)
进行指定:
>>> %(time)s计算机的内存利用率为%(percent)s%%' % {'time':'11:15', 'percent': 75}
'11:15计算机的内存利用率为75%'
对齐选项flags
和宽度选项width
,以及数字类型d
配合使用,可以输出固定格式的数字。例如,输出两位数的月份
>>> '%02d' % 8
'08'
>>> '%02d' % 9
'09'
>>> '%02d' % 10
10
格式字符串中的0
表示右对齐,正数前无符号,复数前加负号,用0
填充空白处,
2
表示宽度,所以个位数的月份的左边会多一位空白位,并会被填充为0。
选项.precison
和浮点数类型配合使用可以格式化指定数量的小数位。
>>> '%.2f' % 75.125
'75.12'
不同进制的格式化
>>> '字符串%(key)s,十进制%(key)d,科学计数%(key)e,八进制%(key)o,16进制%(key)x,unicode字符%(key)c' % {'key': 65}
'字符串65,十进制65,科学计数6.500000e+01,八进制101,16进制41,unicode字符A'
format
方法格式化
python中给字符串对象提供了一个format
方法进行字符串格式化,功能比百分号格式化更强大,并且大力推荐,所以我们要首选使用。
其语法为:
格式字符串.format(参数)
在格式字符串中使用{}
代替%类型符号
作为槽位。
>>> '{}计算机的内存利用率为{}%'.format('11:15', 75)
'11:15计算机的内存利用率为75%'
默认情况下,format
中的位置参数会按照位置与格式字符串中的槽位一一对应。
当format
中的参数使用位置参数时,{}
中可以填写参数的整数索引和参数一一对应。
>>> '{2}{0}{1}'.format(1,2,3)
'312'
当format
中的参数以关键字参数提供时,{}
中需要填写参数名和参数进行对应。
>>> '{time}计算机的内存利用率为{percent}%'.format(time='11:15', percent=75)
'11:15计算机的内存利用率为75%'
{}
中除了填写参数索引或参数名外,还可以填写控制信息来实现更多的格式化功能,语法如下:
{参数名或索引:格式控制标记}
其中格式控制标记的语法如下:
[fill][align][sign][#][0][width][,][.precision][type]
选项功能如下:
-
fill 【可选】空白处填充的字符
-
align 【可选】对齐方式(需配合width使用)
-
- <,内容左对齐
- >,内容右对齐(默认)
- =,内容右对齐,将符号放置在填充字符的左侧,且只对数字类型有效。 即使:符号+填充物+数字
- ^,内容居中
-
sign 【可选】有无符号数字
- +,正号加正,负号加负;
- -,正号不变,负号加负;
- 空格 ,正号空格,负号加负;
-
# 【可选】对于二进制、八进制、十六进制,如果加上#,会显示 0b/0o/0x,否则不显示
-
, 【可选】为数字添加分隔符,如:1,000,000
-
width 【可选】格式化位所占宽度
-
.precision 【可选】小数位保留精度
-
type 【可选】格式化类型
- 传入” 字符串类型 “的参数
- s,格式化字符串类型数据
- 空白,未指定类型,则默认是None,同s
- 传入“ 整数类型 ”的参数
- b,将10进制整数自动转换成2进制表示然后格式化
- c,将10进制整数自动转换为其对应的unicode字符
- d,十进制整数
- o,将10进制整数自动转换成8进制表示然后格式化;
- x,将10进制整数自动转换成16进制表示然后格式化(小写x)
- X,将10进制整数自动转换成16进制表示然后格式化(大写X)
- 传入“ 浮点型或小数类型 ”的参数
- e, 转换为科学计数法(小写e)表示,然后格式化;
- E, 转换为科学计数法(大写E)表示,然后格式化;
- f , 转换为浮点型(默认小数点后保留6位)表示,然后格式化;
- F, 转换为浮点型(默认小数点后保留6位)表示,然后格式化;
- g, 自动在e和f中切换
- G, 自动在E和F中切换
- %,显示百分比(默认显示小数点后6位)
- 传入” 字符串类型 “的参数
输出两位数的月份
>>> '{:0>2}'.format(8)
'08'
其中0
表示要填充的符号,>
表示右对齐,2
表示宽度。
保留两位小数
>>> '{:.2f}'.format(0.75123)
'0.7512'
百分比格式化
>>> '{:.2%}'.format(0.75123)
'75.12%'
各种进制格式化
>>> '字符串{key},十进制{key:d},科学计数{key:e},八进制{key:o},16进制{key:x},unicode字符{key:c}'.format(key=65)
'字符串65,十进制65,科学计数6.500000e+01,八进制101,16进制41,unicode字符A'
f
表达式
3.6版新功能:
格式字符串字面值或这位f-string
是标注了f
或F
前缀的字符串字面值。这是官方文档的中文翻译。我把这种方式的格式化叫做f
表达式,它比format
方法更加的灵活。它的基本语法是:
f'{控制选项}'
其控制选项和format
方法中的一致。
f
字符串的槽位部分直接写变量名,解释器会自动讲变量的值的字符串形式替换。
>>> item = '11:15'
>>> percent = 75
>>> f'{time}计算机的内存利用率为{percent}'
'11:15计算机的内存利用率为75%'
格式输出两位数的月份
>>> month = 8
>>> f'{month:0>2}'
'08'
保留两位小数
>>> time = '11:15'
>>> percent = 0.75123
>>> f'{time}计算机的内存利用率为{percent:.2%}'
'11:15计算机的内存利用率为75.12%'
进制格式化
>>> key = 65
>>> f'字符串{key},十进制{key:d},科学计数{key:e},八进制{key:#o},16进制{key:x},unicode字符{key:c}'
'字符串65,十进制65,科学计数6.500000e+01,八进制0o101,16进制41,unicode字符A'
包含计算表达式的f
字符串
>>> num = -1
>>> f'{num+1=}'
'num+1=0'
>>> f'{num+2}'
'1'
>>> s = 'abcd'
>>> f'{s[::-1]=}'
"s[::-1]='dcba'"
包含函数的f
字符串
>>> num = -1
>>> f'{abs(num)=}'
'abs(num)=1'
>>> f'{abs(num)}'
'1'