文件操作之1,2,3
#文件操作 #计算机知识拾遗: """ 计算机系统分为:计算机硬件,操作系统,应用程序三部分。 我们用python或其他语言编写的应用程序若想要把数据永久保存下来,必须要保存于硬盘中, 这就涉及到应用程序要操作硬件,众所周知,应用程序是无法直接操作硬件的,这就用到了操作系统。 操作系统把复杂的硬件操作封装成简单的接口给用户/应用程序使用,其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念, 用户或应用程序通过操作文件,可以将自己的数据永久保存下来。 有了文件的概念,我们无需再去考虑操作硬盘的细节,只需要关注操作文件的流程 """ #主要有如下操作: #1. 打开文件,得到文件句柄并赋值给一个变量 #2. 通过句柄对文件进行操作 #3. 关闭文件 #在python中打开文件的方式一般为: f=open('b.txt','r',encoding='utf-8') #1. 打开文件,得到文件句柄并赋值给一个变量 #默认打开模式就为r data=f.read()#2. 通过句柄对文件进行操作 f.close()#3. 关闭文件 #python打开文件的回收机制 # 打开一个文件包含两部分资源:操作系统级打开的文件+应用程序的变量。在操作完毕一个文件时, #必须把与该文件的这两部分资源一个不落地回收,回收方法为: # 1、f.close() #回收操作系统级打开的文件 (python中由于有垃圾回收机制,所以一定要close文件) #2、del f #回收应用程序级的变量 #对于没有close的习惯的推荐下列方法: # with关键字来帮我们管理上下文 # with open('a.txt', 'w') as f: # pass # # with open('a.txt', 'r') as read_f, open('b.txt', 'w') as write_f: # data = read_f.read() # write_f.write(data) #还需要注意一点就是字符编码问题: # f=open(...)是由操作系统打开文件,那么如果我们没有为open指定编码,那么打开文件的默认编码很明显是操作系统说了算了, # 操作系统会用自己的默认编码去打开文件,在windows下是gbk,在linux下是utf-8。 # 这就用到了上节课讲的字符编码的知识: # 若要保证不乱码,文件以什么方式存的,就要以什么方式打开。 # f=open('a.txt','r',encoding='utf-8') #这个说明文件当时存储的时候就是UTF8存储的所以要以UTF8打开,不然乱码! #******************************************************************************************************** #文件打开方式 #1. 打开文件的模式有(默认为文本模式): # r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】 # w,只写模式【不可读;不存在则创建;存在则清空内容】 # a, 之追加写模式【不可读;不存在则创建;存在则只追加内容】 #2. 对于非文本文件,我们只能使用b模式,"b"表示以字节的方式操作(而所有文件也都是以字节的形式存储的, # 使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式) # 1 rb 2 wb 3 ab 注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码
# 操作文件的方法 #掌握 # f.read() #读取所有内容,光标移动到文件末尾 # f.readline() #读取一行内容,光标移动到第二行首部 # f.readlines() #读取每一行内容,存放于列表中 # # f.write('aaaa\nbbb\n') #针对文本模式的写,需要自己写换行符 # f.write('aa\nbb\n'.encode('utf-8')) #针对b模式的写,需要自己写换行符 # f.writelines(['333\n','444\n']) #文件模式 # # # f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式 # # #了解 # f.readable() #文件是否可读 # f.writable() #文件是否可读 # f.closed #文件是否关闭 # f.encoding #如果文件打开模式为b,则没有该属性 # f.flush() #立刻将文件内容从内存刷到硬盘 # f.name #4.文件光标的移动 # 1 read()方法 # read(3) 1. 文件打开方式为文本模式时,代表读取3个字符 2. 文件打开方式为b模式时,代表读取3个字节 # 2.其余的文件内光标移动都是以字节为单位如seek,tell,truncate #注意: # # 1. seek有三种移动方式0,1,2,其中1和2必须在b模式下进行,但无论哪种模式,都是以bytes为单位移动的 # seek控制光标的移动,是以文件开头作为参照的。 # tell显示当前光标的位置 #2. truncate是截断文件,截断必须是写模式,但是不能用w或w+等方式打开, # 因为那样直接清空文件了,所以truncate要在r+或a或a+等模式下测试效果