Python档案袋(字符串与二进制的编码与解码)

字符串

字符串支持像列表似得用下标进行取值操作,和进行切片

字符串格式化:

#内容相当于字符串,也可以用双引号包裹
str='''

111
2222
33333
---------东小东-------

'''
print(str)

字符串拼接:

方法1:

每次拼接时会重新开辟内存空间,效率较低

print(""+""+"东小东")  #输出:我是东小东

方法2:

%s为字符串,%d为整数,%f为浮点数等等

print("我是%s%s"%("东小东","-加油"))  #输出:我是东小东-加油

方法3:

如果使用format_map,传递的值为字典

print("我是{namex}{textx}".format(namex="东小东",textx="-加油"))  #输出:我是东小东-加油

方法4:

print("我是{0}{1}".format("东小东","-加油"))  #输出:我是东小东-加油

相关函数:

 1 #字符串
 2 strx="abadefg1"
 3 
 4 print(strx.capitalize()) #首字母大写
 5 print("Dong xiAo".swapcase()) #大小写对应转换,输出:dONG XIaO
 6 print(len(strx)) #字符串长度为8
 7 print(strx.count("a")) #统计字符串a的个数
 8 
 9 print(strx.center(50,"*")) #一共打印50个字符,将strx放在中间,其他使用*号补全
10 print(strx.ljust(50,"*")) #一共打印50个字符,将strx放在左边,其他使用*号补全,对应有 rjust()
11 
12 print(strx.endswith("fg")) #字符串是否与"fg"结尾,返回bool
13 
14 print(strx.find("=2=")) #查找字符串所在位置,失败返回-1,成功返回索引值
15 
16 print("rfid id id".rfind("i")) #从左到右,查找到最右边一个的下标,输出:8
17 
18 
19 print(strx.isalnum()) #是否是只有数字和字母组成,返回bool
20 
21 print(strx.isalpha()) #是否只有字母,返回bool
22 
23 print("10".isdigit()) #是否是整数,返回bool   ,输出:True
24 
25 print("+jj".isidentifier()) #是否是合法变量名,返回bool ,输出:False
26 
27 print("ABcd东".lower())#将大写字母转换为小写,对应有upper()
28 
29 print("abbc".islower()) #是否全为小写,大写为:isupper()
30 
31 print("dong xiao dong1".title()) #各单词首字母大写,输出:Dong Xiao Dong1
32 
33 print("Dong Xiao Dong".istitle()) #判断每个单词首字母是否均为大写,输出:True
34 
35 print("==".join(["111","222","333"])) #集合转换为字符串,并且使用特点字符分隔,输出:111==222==333
36 
37 print("   \tjj\n   ".strip()) #去掉两边空格或回车等,对应还有:lstrip(),rstrip()
38 
39 p=str.maketrans("dongxiao","123GX678") #一一对应关系
40 print("dongxiaodong".translate(p)) #内容替换,输出:183GX678183G
41 
42 print("ABCAB".replace("A","aa")) #替换,输出:aaBCaaB
43 
44 print("dong+xiao+dong".split("+")) #将字符串以"+"分割并保存到列表中,默认分隔符为空格

字符串的排序:

#排序
#转换成列表输出
listx="bbe59210"
print(sorted(listx)) #输出:['0', '1', '2', '5', '9', 'b', 'b', 'e']

判断某个字符串是否是另一个字符串的子字符串,可以使用find(),也可使用:

if "dong" in "dongxiaodong":
    print("存在") #输出

if "dong" not in "xiaoxiao":
    print("不存在") #输出

字符串查找(index)

如果查找的字符串存在则返回位置,不存在则报错

try:
   print("东小东dong".index("donge"))
except ValueError as e:
    print("****异常***",e)

编码和Byte(二进制)

中文编码演变:ASCLL->GB3212->GBK(已支持基本的中文,常用)->GB18030(收录各民族文字),各编码均向下兼容

世界标准:ASCLL(一个字符占一个字节)->Unicode(万国码,一个字符占两个字节)->utf-8(英文一个字符占一个字节,汉字一个字符占三个字节)

其中Python3的默认编码为utf-8

视频及图片的保存是使用二进制格式,Python3的网络编程,传输的信息是需要编码为二进制的

 

编码和解码:

1 #编码,字符串编码为二进制格式
2 #参数表示是以什么编码集进行编码
3 bstr="字符串".encode("gbk") #utf-8
4 
5 #解码,二进制转换为字符串格式
6 #参数表示是以什么编码集进行解码
7 str=bstr.decode("gbk")
8 
9 print(str) #输出:字符串
posted @ 2019-03-16 22:33  东小东  阅读(2214)  评论(0编辑  收藏  举报