caicaix

导航

字符编码和文件操作

字符编码

由于计算机只认识01,字符编码就是我们人看的懂的字符对应机器认识的数字,方便我们与机器交互

 

1.字符编码的发展史

1.一家独大(ASCII码表)

最开始计算器是由美国人发明的,争对他们国家的语言发明了一种编码表 ASCII码表,ASCII码表内置使用一个字节代表一个字符。

需要记忆:

A-Z:65—

a-z:97—

0-9:48—

  字符串的比较是按照ASCII的十进制数进行比较的

 

2.群雄割据

各个国家也想使用计算器,就自己开发了一套自己的编码表

GBK码表(中国):它的内部记录了英文、中文和数字之间的对应关系,它是一个字节保存英文,两个字节保存中文。

shift_JIS表(日本)、Euc-kr表(韩国)

 

3.一统天下(unicode→utf8编码)

为了让世界上的所有国家之间能够彼此无障碍的交流,统一使用了编码,unicode(万国码),他的内部统一使用两个字节保存字符或者更多字符。

占用内存多了,进行优化就产生了utf8编码,中文现在用三个字节保存

 

PS:

其他编码:utf-8、utf-16、utf-32·····utf8mb4(存表情)

 

 

字符编码实操

1.编码(encode)

1 s = 'hello你好哈'
2 res = s.encode('utf8')
3 print(res)  # b'hello\xe4\xbd\xa0\xe5\xa5\xbd\xe5\x93\x88'

 

2。解码(decode)

1 s = 'hello你好哈'
2 res = s.encode('utf8')
3 print(res)  # b'hello\xe4\xbd\xa0\xe5\xa5\xbd\xe5\x93\x88'
4 res1 = res.decode('utf8')
5 print(res1)    # hello你好哈

 

 

文件操作

当文件数量比较多的时候,借助代码来打开文件

1.操作文件

三步骤:

1.打开文件

2.操作文件

3.关闭文件

  

1.方式一

1 f = open('a.txt', 'r', encoding='utf8')
2 print(f.read())
3 
4 # 关闭文件
5 f.close()

 

2.方式二(with上下文管理器)

1 with open('a.txt', 'r', encoding='utf8') as f:
2     print(f.read())
3 # 内部自动关闭close

 

posted on 2023-05-23 16:49  菜CAIx  阅读(9)  评论(0编辑  收藏  举报