python 内置数据类型之字符串

1.3 字符串

字符串本身就是一个有序(从左至右)的字符的集合。是序列这种类型的一种，后面还要学习列表与元组。在这一节中，需要了解字符串的定义,特殊字符，转义与抑制转义；字符串基本操作、格式化等。先看下面表格,本节学习的主要内容就在下面的表格中：

分类	操作	解释	python2.6	python 3.0
定	s=''	定义空字符串
义	s="halberd's",'halberd\'s'	使用单引号或者双引号定义字符串
	s="""…"""
	s=''' …'''	三重引号定义多行字符串
	s=r'\temp\halberd'	定义raw字符串,取消转义
	s=b'halberd'	python3.0 开始出现，定义字节字符串	N
	s=u'halberd'	仅在python2.6中使用unicode字符串		N
字	s1 + s2	字符串合并
符	s1 * n	重复 n 次
串	s[i]	使用字符串索引，i>=0,为整数。
操	s[i:k]	字符串分片，取出从i到k的内容
作	len(s)	取字符串的个数
	s.find('ha')	返回匹配到的内容的索引值
	s.[l \| r]strip()	移除(左 \| 右）左右两边的空格
	s.replace	字符替换
	s.split(',')	指定分隔符将字符串进行分隔（分隔后变为列表）
	s.isdigit()	判断是否为整数
	s.upper()/s.lower()	大小写转换
	s.endswith('value')	匹配字符串结尾
	s.join(strlist)	在strlist中以s为分隔符将s插入各个字符之间
	s.encode('utf8')	指定编码
	'a' in 'b'	判断 a 是否包含于b
格	"a %s parrot" % kind	字符串格式化表达式
式	”a {0} parrot".format(kind)	字符串格式化方法
化
迭	[c*2 for c in s]	迭代，把S中的字符逐一重复2次，并将结果转换为列表
代	map(ord,s)	将字符串s中的值逐一传入函数ord(用于置换为ASCII)，map把计算结果以列表形式返回结果

NOTE:

在python中，单引号与双引号的作用是一样的。

转义及特殊字符

在编写程序的过程中难免会遇到使用特殊字符的情况。对特殊字符的转义及抑制转义需要有所了解。 python中的转义符是 "/" . 可以通过转义符将特殊字符转义，使特殊字符以字符串本身存在。也可以在定义字符串时通过关键字母 r 来定义为raw-string,如 s=r'halberd\n' ,这种写法，"\n" 会以字符串本身存在，不代表任何特殊意义。

Table 5: 特殊字符及转义符使用示例
示例	意义
\\	保留\
\'	保留'
\"	保留”
\a	响铃
\b	退格，删除前面一个字符
\f	换页
\n	新起一行
\t	横向制表符
\v	垂直+横向制表符,以上一行为基准
\0	NULL(不是字符串结尾)
\o	八进制
\x	16进制
\U	unicode 32位的16进制
\u	Unicode 16位的16进制

索引和分片

字符串索引的表示方法为：s[i], s 为字符串变量、常量，i代表索引序号。假设字符串变量s的值被定义为'halberd'，即(s='halberd'),则将该值的内容想像为：

h	a	l	b	e	r	d
0	1	2	3	4	5	6
-7	-6	-5	-4	-3	-2	-1

索引的序号与实际的字符串中字符对应关系如上。i=0 ,代表了字符串从左至右数第一个字符,当从左至右对应字符串索引时，序号i的取值范围为0 –> len(s)-1。 i = -1时，从右至左对应字符串索引,i 的取值范围为 -len(s) –> -1.

分片的表示方法为: s[i:j:n]或者s[slice(i,j,n)],取出字符串的索引序号范围为大于等于i 并且小于j, 由前两个参数确定取值范围后,从第一个值开始，以N 为间隔进行取值。如果n 为负数，则值的显示顺序与原字符串的排列顺序相反。第三个参数 n 可以省略，默认为1. 第二个参数可省略，默认为最后一个字符。

字符串格式化

如今python 中有两路方法来实现字符串格式化：表达式/ 格式化方法调用。表达式是python 诞生以来就存在的，而方法调用则是从python2.6开始的。先从表达式开始。在了解格式化的具体方法之前，先来了解下转换目标。所谓的转换目标就是要把我们需要的值代入的位置(可以理解为占位符)：

Table 6: 转换目标
置换目标	意义
s	字符串
r	s,但是使用的是repr,而不是str
c	字符
d	十进制整数
i	integer,整数
u	unsigned integer,无符号整数
o	八进制整数
x	十六进制整数
X	x,输出时为大写
e	浮点指数
E	e,输出时为大写
f	浮点十进制数
F	f,输出时为大写
g	e/f
G	E/F
%	常量%

转换目标的结构如下： %[(name)][flags][width].[precise]typecode

%[(name)][stuff-things][position][width].[precise]typecode

其中(name) 需要与字典配合使用,与字典中的name 对应,待学习字典后有更明确的了解。

flags可以有+,-,=,^,' '或0。+表示右对齐。-表示左对齐,=代表一个标记字符后的补充，^ 代表居中。' '为一个空格，表示在正数的左侧填充一个空格,为默认方式，从而与负数对齐。0表示使用0填充。

width 表示整数部分(包含一切字符)+小数点+小数各部分字符个数最大显示个数。

precision表示小数点后精度

[ ] 表达式格式以% 为分隔，左侧为包含占位符(%d %s 等)的内容，%右侧为占位符对应的值。

'That is %d %s birds!' % (1,dead)
’That is %05.2d %s birds!' % (1,dead) -- 试试将05改为5, 将d 改为f 会有什么结果
'That is %(num)05.2d %(stat)s birds!' % {"stat":'dead',"num":1} -- 试试将单引号去掉，将双引号去掉

如果在运行时才能计算得出width.precise ，那么可以一预定义格式的时候，在width 与precise 位置上用* 代替. 如: '%f,%.2f,%*.*f' % (1/3.,1/3.,2,4,1/3.)

一个* ,按出现顺序，要在 % 后面相应顺序位置提供值。像上面的示例，width = 2 ,precise = 4. 最后一个1/3. 为%*.*f 的值。

[ ] 方法调用方法调用，使用的是string.format 来实现。在string 所代表的字符串中，可以使用{n}（位置参数）或者{key}（名称参数) 作为替换目标。

结构: 参数书写格式为:{key:[填充字符][对齐方式][宽度][.精度][数据类型]} '参数'.format('value1',key1='value',…….)

示例：

>>> '{motto},{0},{1},{food}'.format(1,2,motto='3.14',food=[1,2])
'3.14,1,2,[1, 2]'

其中{n}(位置参数) 中，n>=0. {0} 代表{n}中的第一个参数，{1}代表第二个可取参数。 {key}（关键字参数) 与 key=value格式中的key 要一一对应。{n}的值不能在key=value格式中取值。

note

位置参数值不得在名称参数值之后 。

[ ] (no term)

位置参数示例：

>>> s=['halberd',18]
>>> x='My name is {0:10s}, {1:-=10d} years old.'
>>> x.format('halberd',18)
'My name is halberd   , --------18 years old.'
''' 注意下面写法。将列表中的值作为参数值传入字符串参数中。在指向列表的变量前加*
'''
>>> 'My name is {}, {} years old.'.format(*s)     ''' 注意此种写法: *变量名'''
'My name is halberd, 18 years old.'

[ ] (no term)

关键字参数示例:

>>> x='My name is {name},{age} years old. I\'ve been HZ for {0} years.'
>>> x.format(8,name='halberd',age=18)
"My name is halberd,18 years old. I've been HZ for 8 years."
s={'name':'halberd','age':18,8}
''' 注意下面用法. 将字典值作为参数值传入。在字典变量前加** 即可。因为关键词有对应关系，书写顺序对值的对应无影响
'''
>>> s={'age':18,'name':'halberd','year':8}
>>> x='My name is {name},{age} years old. I\'ve been HZ for {year} years.'
>>> x.format(**s)
"My name is halberd,18 years old. I've been HZ for 8 years."

[ ] 填充与格式化

　　对齐方式有:

　　< 左对齐

　　> 右对齐

　　= 一个标记字符后的补充(右对齐)

^ 居中

对比下下面不同的对齐方式。

>>>s={'age':18,'name':'halberd','year':8}
>>>'''居中对齐'''
'居中对齐'
>>> x='My name is {name},{age:-^10} years old. I\'ve been HZ for {year} years.'  
>>> x.format(**s)
"My name is halberd,----18---- years old. I've been HZ for 8 years."        
>>> '''左对齐''' 
'左对齐'
>>> x='My name is {name},{age:-<10} years old. I\'ve been HZ for {year} years.'
>>> x.format(**s)
"My name is halberd,18-------- years old. I've been HZ for 8 years."
>>> x='My name is {name},{age:+=10} years old. I\'ve been HZ for {year} years.'
>>> x.format(**s)
"My name is halberd,++++++++18 years old. I've been HZ for 8 years."
>>> '''右对齐''' 
'右对齐'
>>> x='My name is {name},{age:->10} years old. I\'ve been HZ for {year} years.'  
>>> x.format(**s)
"My name is halberd,--------18 years old. I've been HZ for 8 years."

[ ] 精度与进制调用format方法，不能将整数值格式化为浮点数。但是可以转换为其他进制。字符串不能转换为其他进制。

# 精度控制
>>> s=3.1415926
>>> x='Pi is {:.4f}'
>>> x.format(s)
'Pi is 3.1416'
>>> # 进制转换
...
>>> x='My name is {name},{age:-^10o} years old. I\'ve been HZ for {year} years.'
>>> x.format(**s)
"My name is halberd,----22---- years old. I've been HZ for 8 years."

posted @ 2017-12-20 12:14 halberd.lee 阅读(401) 评论(0) 收藏举报

刷新页面返回顶部

halberd's blog

python 内置数据类型之字符串

1.3 字符串

公告