关于编码的一些小总结

编码二

   1,不同的密码本之间的二进制是不能互相识别的,容易报错或者产生乱码。

    2,计算机的文件存储和传输都是0101010(gbk,utf-8,ascii,gb2312等)不能是unicode。

    大前提:python3x,编码。

    bytes :str 拥有的所有方法,bytes都有。

   python3x 内存中的编码方式是unicode

        英文:

            str: 表现形式  name = "alex"

                 内部编码:unicode

 

 

            bytes:表现形式:name1 = b"alex"

                 内部编码:非unicode

 

        中文:

            str: 表现形式  name = "中国"

                 内部编码:unicode

 

 

            bytes:表现形式:b'\xe4\xb8\xad\xe5\x9b\xbd'

                   内部编码:非unicode

name ="中国".encode('utf-8')
name1 =b'alex'
print(name,type(name))
print(name1,type(name1))




b'\xe4\xb8\xad\xe5\x9b\xbd' <class 'bytes'>
b'alex' <class 'bytes'>
# name = "alex"
# name1 = b"alex"
# print(name,type(name))
# print(name1,type(name1))






alex <class 'str'>
b'alex' <class 'bytes'>


# str ---> bytes
s1 = '中国'
b1 = s1.encode('utf-8') # encode 编码
b2 = s1.encode('gbk')
print(b1)
print(b2)
s2 = b1.decode('utf-8') # decode 解码
print(s2)

b'\xe4\xb8\xad\xe5\x9b\xbd'
b'\xd6\xd0\xb9\xfa'

中国

# utf-8 bytes  ---> gbk bytes

s1 = b"alex"
print(s1.capitalize())







b'Alex'

 

posted @ 2018-05-05 13:07  HoneyCY  阅读(247)  评论(0编辑  收藏  举报