python基础09 字符编码、文件操作、
字符编码
前提:字符编码只跟文本数据和字符串有关
字符编码:内部记录着字符和数字之间对应的关系
字符编码的发展史
1. 一家独大
计算机刚开始是老美发明的,他们肯定想让计算机读懂英文
ASCII码表:它内部记录了英文字符和数字之间的关系
ASCII码表内部使用一个字节代表一个字符
一个字节等于八位
需要记忆:
A-Z:65-
a-z:97-
0-9:48-
z字符串的比较:是按ASCII码表的十进制数进行比较的
print(‘hello’>‘world’)
2. 群雄割据
每个国家都开发一套适合自己的编码表
中国:gbk码表
它内部记录了英文、中文和数字之间对应的关系
2**16==65536
它使用一个字节保存一位英文字符,使用两个字节保存一个中文字符
小日本:shift_JIS
韩国:EUC_kr
3.天下一统
为了让各国更好交流,使用了统一的代码
unicode(万国码)
它内部统一使用两个字节保存字符或者跟多字符
由于原来英文字符使用一个字节保存,现在万国码表使用两个字节保存,浪费资源
utf8(万国码优化版)
原来使用一个字节保存引文字符,现在也是
中文字符使用三个字节保存
2**24
补充:
utf_8、utf_16、utf_32、utf8mb4
字符编码实操
1.解决字符编码乱码的问题
写的时候用什么编码,打开就用什么编码
2.Python解释器代码差异
Python2中
默认使用ASCII码表,写代码时在前面注释一个(coding:utf_8)
Python3中
默认的是utf-8
3.编码与解码
编码(encode):把其他字符转为二进制的过程
解码(decode):把二进制转为其他字符的过程
文件操作
1.为什么要是用代码操作
当文件数量比较多的时候,人工操作就不太方便了,借助代码操作
2.如何操作文件
三个步骤:
* 打开文件
*操作文件(读、写过程)
*关闭文件
在路径中如果出现了斜杠和字母连用的情况,为了不出现歧义,在字符前面加一个r
r'D:\python26\day09\aa\a.txt
打开文件:
方式一:
1 f=open('a.txt', 'r', encoding='utf8') 2 # print(f) # <_io.TextIOWrapper name='a.txt' mode='r' encoding='utf8'> 3 print(f.read()
关闭文件:
f.close()
释放资源
方式二:
with上下文管理器
with open('a.txt', 'r', encoding='utf8') as ffffff: print(ffffff.read()
不需要编写关闭文件代码块,内部自动关闭
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY