python基础09 字符编码、文件操作、

字符编码

前提:字符编码只跟文本数据和字符串有关

字符编码:内部记录着字符和数字之间对应的关系

 

字符编码的发展史

1. 一家独大

计算机刚开始是老美发明的,他们肯定想让计算机读懂英文

ASCII码表:它内部记录了英文字符和数字之间的关系

  ASCII码表内部使用一个字节代表一个字符

  一个字节等于八位

需要记忆:

  A-Z:65-

  a-z:97-

  0-9:48-

z字符串的比较:是按ASCII码表的十进制数进行比较的

      print(‘hello’>‘world’)

2. 群雄割据

每个国家都开发一套适合自己的编码表

中国:gbk码表

  它内部记录了英文、中文和数字之间对应的关系

  2**16==65536

它使用一个字节保存一位英文字符,使用两个字节保存一个中文字符

小日本:shift_JIS

韩国:EUC_kr

3.天下一统

为了让各国更好交流,使用了统一的代码

  unicode(万国码)

  它内部统一使用两个字节保存字符或者跟多字符

      由于原来英文字符使用一个字节保存,现在万国码表使用两个字节保存,浪费资源

  utf8(万国码优化版)

  原来使用一个字节保存引文字符,现在也是

  中文字符使用三个字节保存

  2**24  

补充:

  utf_8、utf_16、utf_32、utf8mb4

字符编码实操

1.解决字符编码乱码的问题

  写的时候用什么编码,打开就用什么编码

2.Python解释器代码差异

  Python2中

  默认使用ASCII码表,写代码时在前面注释一个(coding:utf_8)

  Python3中

  默认的是utf-8

3.编码与解码

  编码(encode):把其他字符转为二进制的过程

  解码(decode):把二进制转为其他字符的过程

文件操作

1.为什么要是用代码操作

  当文件数量比较多的时候,人工操作就不太方便了,借助代码操作

2.如何操作文件

三个步骤:

  * 打开文件

  *操作文件(读、写过程)

  *关闭文件

在路径中如果出现了斜杠和字母连用的情况,为了不出现歧义,在字符前面加一个r

    r'D:\python26\day09\aa\a.txt

打开文件:

  方式一:

1 f=open('a.txt', 'r', encoding='utf8')
2 # print(f)  # <_io.TextIOWrapper name='a.txt' mode='r' encoding='utf8'>
3 print(f.read()

关闭文件:

  f.close()

  释放资源

  方式二:

      with上下文管理器

with open('a.txt', 'r', encoding='utf8') as ffffff:
    print(ffffff.read()

不需要编写关闭文件代码块,内部自动关闭

 

posted @   Py玩家  阅读(15)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
点击右上角即可分享
微信分享提示