Python 字符串格式化

转载请注明出处

Python2.6+ 增加了str.format函数,用来代替原有的'%'操作符。它使用比'%'更加直观、灵活。下面详细介绍一下它的使用方法。

下面是使用'%'的例子:

""
"PI is %f..." % 3.14159 # => 'PI is 3.141590...'
"%d + %d = %d" % (5, 6, 5+6) # => '5 + 6 = 11'
"The usage of %(language)s" % {"language": "python"} # => 'The usage of python'

格式很像C语言的printf是不是?由于'%'是一个操作符,只能在左右两边各放一个参数,因此右边多个值需要用元组或者字典来包括,不能元组字典一起用,缺乏灵活度。
同样的例子用format方法改写:

"PI is {0}...".format(3.14159) # => 'PI is 3.14159...'
"{0} + {1} = {2}".format(5, 6, 5+6) # => '5 + 6 = 11'
"The usage of {language}".format(language = "Python") # => 'The usage of Python'

是不是很直观?(当然,使用C语言的我也很喜欢前一种格式表达方式 😃 )

格式化字符串

"{named} consist of intermingled character {0} and {1}".format("data", "markup", \
    named = "Formats trings")
format(10.0, "7.3g") # => '     10'
"My name is {0} :-{{}}".format('Fred') # => 'My name is Fred :-{}'

注意第一行的'',如果一个语句要换行,必须在结尾加上反斜线转义。
用'%'无法像这样将元组和字典混用。其实这里是命名参数,Python的一个特性。可以在定义数组的时候用*args, **kwargs语法展开集合和字典。需要注意,命名参数放在后面。
第二个语句表示format内置函数用来格式化单个值。
第三个语句表示了{}的转义,因为{}在被格式化字符串里是特殊字符,不能直接显示。转义方式是多嵌套一层。

使用属性和索引

"My name is {0.name}".format(open('out.txt', 'w')) # => 'My name is out.txt'

'{0.name}' 相当于调用对象的属性 open('out.txt', 'w').name

"My name is {0[name]}".format(dict(name='Fred')) # => 'My name is Fred'

使用索引也是可以的。
obj[key] 相当于 obj.getitem('key')

标准说明符(Specifiers)

写过C语言的程序员应该清楚printf的复杂。format也定义了很多标准的说明符,用来解释一个值的格式,然后插入字符串内。例如:

"My name is {0:8}".format('Fred') # => 'My name is Fred    '

':'之后便是说明符了,上面例子中说明符只有一个'8'(minimumwidth),它表示插入的值宽度至少为8。'Fred'只有4,所以又加了4个空格。

说明符的详细格式为:
[[fill]align][sign][#][0][minimumwidth][.precision][type]
(不比C的printf更简洁啊!)
注意:'[]'表示该元素可选。所以,所有的格式说明符都是可选的!就像之前的例子,几乎都没有用这个(只是为了例子更清晰)。实际上,这些是很有用的。

我们一个个来看:

  • [fill]align 表示排列方式。当minimumwidth设置的比插入的值大时,就有了留白,就像上一个例子中的'My name is Fred '。默认把留白放在了右边,也就是说插入值默认是左对齐的。如果我们试试{0:>8},会发现结果变成了'My name is Fred'
    fill 表示用来填充留白的字符。只有在align指定了的情况下fill才有用! align可以是下面的标识:
    • < 左对齐,默认
    • > 右对齐
    • = 将留白放在align标识后面,只对数字有效。什么意思呢?align下面会讲到,显示数字的正负号,同样只对数字有效。如果指定了'=',那么就会把数字的正负号显示在留白的前面。例如:format(-12, "0=8") # => '-0000012' 注意这里用的是格式化单个值的内置函数format。'0'是fill元素,用它来填充留白;'='就是该标识了;'8'是指最小宽度为8,因此才有5个留白。那么align呢?align其实就是说明正负号的显示方式,这里使用默认的'-',之后会讲到。
    • ^ 居中对齐
  • sign 数字符号,只对数字有效。
    • + 显示加号和减号
    • - 不显示加号,显示减号。在不指定最小宽度的情况下负数总是比正数多占一个符号位置。默认
    • ' ' (一个空格) 用一个留白代替加号
  • # 显示数字的前缀表示几进制(0b, 0o, 0x)
  • 0 用'0'填充留白。
  • minimumwidth 指定最小宽度,已经用过很多次了。
  • .precision 'precision'是一个十进制数字,表示显示小数点后几位。
  • type 值的类型:
    • 整型:
      • b 二进制
      • c 字符型,把数字转成表示unicode的字符
      • d 十进制
      • o 八进制
      • x 十六进制,显示小写字母
      • X 十六进制,显示大写字母
      • nd行为相同,使用本地的数字表示方式
      • ''(空,没有空格) 与d相同
    • 浮点数
      • e 科学计数法表示,小写e
      • E 科学计数法表示,大写E
      • f 显示为定点数,默认小数点后六位
      • Ff
      • g 自动选择是否用科学记数法表示
      • Gg
      • ng,使用本地表示方式
      • % 使用百分比表示
      • ''(空) 同g

每个对象可以重写自己的格式化说明符,例如datatime类重写了后可以这样表示:

"Today is: {0:%a %b %d %H:%M:%S %Y}".format(datetime.now())

预先转换

':'之后是格式说明符,之前还可以加预先转换的标识

  • !r 调用对象的____repr____方法来转换成标准字符串
  • !s 调用对象的____str____方法来转换成字符串

重写____format____方法

我们在格式化一个字符串时,首先格式化每个值,然后再插入字符串内。格式化值调用的就是format内置方法。format则是简单地调用该值的____format____方法。

def format(value, format_spec):
    return value.__format__(format_spec)

在object类内实现了____format____方法,只是将本身用str()转换成字符串,然后将字符串传入内置的format方法,实际上就是调用转换为字符串后的____format____方法。

class object:
    def __format__(self, format_spec):
        return format(str(self), format_spec)

int/float/str自身实现了____format____方法,前面已经介绍了它们各自的说明符。

结束语

还有一点儿是自定义Formatter,不过平常也用不到。留作下篇string模块源码解读的内容吧。建议有兴趣的朋友多看看Python标准库的源码,很有学习价值。

参考:https://www.python.org/dev/peps/pep-3101/

posted @ 2017-02-19 23:07  新月的力量_141  阅读(1915)  评论(0编辑  收藏  举报