Python 字符串格式化
转载请注明出处
Python2.6+ 增加了str.format函数,用来代替原有的'%'操作符。它使用比'%'更加直观、灵活。下面详细介绍一下它的使用方法。
下面是使用'%'的例子:
""
"PI is %f..." % 3.14159 # => 'PI is 3.141590...'
"%d + %d = %d" % (5, 6, 5+6) # => '5 + 6 = 11'
"The usage of %(language)s" % {"language": "python"} # => 'The usage of python'
格式很像C语言的printf是不是?由于'%'是一个操作符,只能在左右两边各放一个参数,因此右边多个值需要用元组或者字典来包括,不能元组字典一起用,缺乏灵活度。
同样的例子用format方法改写:
"PI is {0}...".format(3.14159) # => 'PI is 3.14159...'
"{0} + {1} = {2}".format(5, 6, 5+6) # => '5 + 6 = 11'
"The usage of {language}".format(language = "Python") # => 'The usage of Python'
是不是很直观?(当然,使用C语言的我也很喜欢前一种格式表达方式 😃 )
格式化字符串
"{named} consist of intermingled character {0} and {1}".format("data", "markup", \
named = "Formats trings")
format(10.0, "7.3g") # => ' 10'
"My name is {0} :-{{}}".format('Fred') # => 'My name is Fred :-{}'
注意第一行的'',如果一个语句要换行,必须在结尾加上反斜线转义。
用'%'无法像这样将元组和字典混用。其实这里是命名参数,Python的一个特性。可以在定义数组的时候用*args, **kwargs语法展开集合和字典。需要注意,命名参数放在后面。
第二个语句表示format内置函数用来格式化单个值。
第三个语句表示了{}的转义,因为{}在被格式化字符串里是特殊字符,不能直接显示。转义方式是多嵌套一层。
使用属性和索引
"My name is {0.name}".format(open('out.txt', 'w')) # => 'My name is out.txt'
'{0.name}' 相当于调用对象的属性 open('out.txt', 'w').name
"My name is {0[name]}".format(dict(name='Fred')) # => 'My name is Fred'
使用索引也是可以的。
obj[key] 相当于 obj.getitem('key')
标准说明符(Specifiers)
写过C语言的程序员应该清楚printf的复杂。format也定义了很多标准的说明符,用来解释一个值的格式,然后插入字符串内。例如:
"My name is {0:8}".format('Fred') # => 'My name is Fred '
':'之后便是说明符了,上面例子中说明符只有一个'8'(minimumwidth),它表示插入的值宽度至少为8。'Fred'只有4,所以又加了4个空格。
说明符的详细格式为:
[[fill]align][sign][#][0][minimumwidth][.precision][type]
(不比C的printf更简洁啊!)
注意:'[]'表示该元素可选。所以,所有的格式说明符都是可选的!就像之前的例子,几乎都没有用这个(只是为了例子更清晰)。实际上,这些是很有用的。
我们一个个来看:
- [fill]align 表示排列方式。当minimumwidth设置的比插入的值大时,就有了留白,就像上一个例子中的
'My name is Fred '
。默认把留白放在了右边,也就是说插入值默认是左对齐的。如果我们试试{0:>8},会发现结果变成了'My name is Fred'
。
fill 表示用来填充留白的字符。只有在align指定了的情况下fill才有用! align可以是下面的标识:- < 左对齐,默认
- > 右对齐
- = 将留白放在align标识后面,只对数字有效。什么意思呢?align下面会讲到,显示数字的正负号,同样只对数字有效。如果指定了'=',那么就会把数字的正负号显示在留白的前面。例如:
format(-12, "0=8") # => '-0000012'
注意这里用的是格式化单个值的内置函数format。'0'是fill元素,用它来填充留白;'='就是该标识了;'8'是指最小宽度为8,因此才有5个留白。那么align呢?align其实就是说明正负号的显示方式,这里使用默认的'-',之后会讲到。 - ^ 居中对齐
- sign 数字符号,只对数字有效。
- + 显示加号和减号
- - 不显示加号,显示减号。在不指定最小宽度的情况下负数总是比正数多占一个符号位置。默认
- ' ' (一个空格) 用一个留白代替加号
- # 显示数字的前缀表示几进制(0b, 0o, 0x)
- 0 用'0'填充留白。
- minimumwidth 指定最小宽度,已经用过很多次了。
- .precision 'precision'是一个十进制数字,表示显示小数点后几位。
- type 值的类型:
- 整型:
- b 二进制
- c 字符型,把数字转成表示unicode的字符
- d 十进制
- o 八进制
- x 十六进制,显示小写字母
- X 十六进制,显示大写字母
- n 与d行为相同,使用本地的数字表示方式
- ''(空,没有空格) 与d相同
- 浮点数
- e 科学计数法表示,小写e
- E 科学计数法表示,大写E
- f 显示为定点数,默认小数点后六位
- F 同f
- g 自动选择是否用科学记数法表示
- G 同g
- n 同g,使用本地表示方式
- % 使用百分比表示
- ''(空) 同g
- 整型:
每个对象可以重写自己的格式化说明符,例如datatime类重写了后可以这样表示:
"Today is: {0:%a %b %d %H:%M:%S %Y}".format(datetime.now())
预先转换
':'之后是格式说明符,之前还可以加预先转换的标识
- !r 调用对象的____repr____方法来转换成标准字符串
- !s 调用对象的____str____方法来转换成字符串
重写____format____方法
我们在格式化一个字符串时,首先格式化每个值,然后再插入字符串内。格式化值调用的就是format内置方法。format则是简单地调用该值的____format____方法。
def format(value, format_spec):
return value.__format__(format_spec)
在object类内实现了____format____方法,只是将本身用str()转换成字符串,然后将字符串传入内置的format方法,实际上就是调用转换为字符串后的____format____方法。
class object:
def __format__(self, format_spec):
return format(str(self), format_spec)
int/float/str自身实现了____format____方法,前面已经介绍了它们各自的说明符。
结束语
还有一点儿是自定义Formatter,不过平常也用不到。留作下篇string模块源码解读的内容吧。建议有兴趣的朋友多看看Python标准库的源码,很有学习价值。