字符编码、文件处理

"""
一:字符编码
字符编码就是将一个字符转化成一串电脑能懂得二进制的过程就叫字符编码。
字符编码是将字符通过固定的格式转化的过程。
字符编码表就是字符转化的标准。
阶段一:现代计算机起源于美国,最早诞生也是基于英文考虑的ASCII
阶段二:为了满足中文和英文,中国人定制了GBK
阶段三:1、能够兼容万国字符
2、与全世界所有的字符编码都有映射关系,这样就可以转换成任意国家的字符编码
Unicode与UTF—8
内存中统一采用unicode,浪费空间来换取可以转换成任意编码(不乱码),
硬盘可以采用各种编码,如utf-8,保证存放于硬盘或者基于网络传输的数据量很小,提高传输效率与稳定性。
通常乱码主要是两种情况:
1.保存文件与读取文件用的不是用一种编码表。
2.保存过程中有保存时使用的编码表不能识别的字符。
一般为了不乱码,会在文件开头指定编码表:coding;UTF-8。coding表示使用字符编码表,冒号后面接编码表。
总结:
1、保证不乱吗的核心法则就是,字符按照什么标准而编码的,就要按照什么标准解码,此处的标准指的就是字符编码
2、在内存中写的所有字符,一视同仁,都是unicode编码,
比如我们打开编辑器,输入一个“你”,我们并不能说“你”就是一个汉字,此时它仅仅只是一个符号,
该符号可能很多国家都在使用,根据我们使用的输入法不同这个字的样式可能也不太一样。
只有在我们往硬盘保存或者基于网络传输时,才能确定”你“到底是一个汉字,还是一个日本字,这就是unicode转换成其他编码格式的过程了

二:文件处理:
文件处理三种模式:r w a
r表示的是read 只读模式。即只读文件,不可以写。
只读模式的操作:
read 读取全部代码
readline 读取一行代码
readlines 读取全部行代码
readable 判断是否可读
w表示的是write 只写模式。即只能写 不能读。
只写模式的操作:
write 将字符写入文件
writelines 将多个内容分批次写入文件。
writeable 判断是否可写
文件处理两种内容:t b


"""
posted @ 2019-01-07 21:22  XSHUshu  阅读(121)  评论(0编辑  收藏  举报