Python 入门 之 编码
1、编码初识
(1)ASCII码 :256 个 英文1个字节,不支持中文
(2)GBK(国标码) : 英文1个字节 中文两个字节
(3)unicode (万国码):英文4个字节 中文4个字节
(4)Utf-8 :最流行的编码集(密码本) 英文1个字节;欧洲2个字节;亚洲3个字节
Win – 编码gbk linux – 编码utf-8 mac – 编码utf-8
2、编码进阶
(1)编码:
<1> ASCII码:
支持:英文,数字,符号 1字节
不支持:中文
<2> GBK(国标):
支持:英文,数字,符号 --- ASCII 1字节
支持:中文 2字节
<3> Unicode(万国码):
支持:英文,数字,符号 ---ASSCII 4字节
支持:欧洲 4字节
支持:亚洲 4字节
<4> Utf – 8:
支持:英文,数字,符号 --- ASSCII 1字节
支持:欧洲 2字节
支持:亚洲 3字节
<5> 字节名.encode(“utf-8”) # 编码
s = "今天"
s1 = s.encode("utf-8") # 编码
print(s1) # b'\xe4\xbb\x8a\xe5\xa4\xa9'
<6> 字节名.decode(“utf-8”) # 解码
s = "今天"
s1 = s.encode("utf-8") # 编码
s2 = s1.decode("utf-8") # 解码
print(s2) # '今天'
# 用什么编码就要用什么解码
Python3:默认编码 unicode
Python2:默认编码 ASCII Python2不支持中文
3、单位转换
1字节 == 8位 (10101001)
字节:存储和传输, 网络传输一定是字节
1字节 == 8位 ( 1Bytes == 8bit )
1B == 8b
1KB == 1024 B
1MB == 1024 KB
1GB ==1024 MB
1TB ==1024 GB
1PB ==1024 TB
1EB ==1024 PB
天之涯,海之角,吾与money天荒地老。