Python之文件操作
day8
文件操作:
一、文件的定义:
1、什么是文件?
文件是操作系统为应用程序或者用户提供的一种操作硬盘的虚拟单位!
注:a、文件是操作系统提供的虚拟单位;
b、应用程序或者用户对文件的读写操作其实都是在向操作系统发送请求指令。
2、为何要用文件?
文件对应的是硬盘空间(可以永久保存数据),如需要考虑永久保留数据,则必须考虑文件操作!
3、如何用文件?
a、文件路径的问题:绝对路径和相对路径
b、文件的打开操作:
# f=open(r'D:\脱产5期内容\day09\a.txt',mode='rt',encoding='utf-8') #使用open时填写的三个参数 # print(f)
c、读写文件:
# data=f.read() #将文件内容一次性全部读取出来 # print(data)
d、关闭文件:
# f.close() # 向操作系统发送指令,让操作系统关闭打开的文件,回收操作系统资源 # 文件打开: 内存将硬盘中的文件读取到内存(应用程序的内存)中 操作系统调用相关功能操作内存中文件 # 文件关闭: 由上可知 文件的关闭需要关闭两部分 应用程序(python解释器自动关闭 回收机制) 操作系统手动关闭,即f.close()。
e、上下文管理:
with open('a.txt',mode='rt',encoding='utf-8') as f: #用with打开文件 无需自己考虑文件关闭(他会自动调用close关闭文件) data=f.read() print(data)
二、文件的打开模式:
1、控制文件读写操作的模式:r(python解释器默认方式) w a
a、r模式详细介绍:
r(默认):只读模式,以该模式打开文件,当文件不存在时则报错,当文件存在时文件指针在文件开头
# with open('a.txt',mode='rt',encoding='utf-8') as f: # data=f.read() 将文件内容一次性全部读取到内存 # print(f.readable()) 文件是否可读 # print(f.writable()) 文件是否可写 # line=f.readline() 按行读取 一次只能读取一行 # print(line,end='') # print('第三次读') # line = f.readline() # print(line, end='') # print(data,type(data)) # for line in f: 理解为f.read的底层实现 # print(line) # print(f.readlines()) 将文件按行读取到一个列表中 # pass
b、w: 只写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时清空文件内容,文件指针在文件开头
# with open('a.txt',mode='wt',encoding='utf-8') as f: # print(f.readable()) # print(f.writable()) # 在打开了文件不关闭的情况下,连续的写入,新写的内容总是跟在老内容之后 # f.write('你瞅啥\n') # f.write('瞅你那熊样\n') # f.write('巴拉巴拉。。。\n') # lines=['1111\n','2222\n','3333\n'] # for line in lines: # f.write(line) 可以理解为writelines的底层实现 # f.writelines(lines) # f.write('aaaa\nbbb\ncccc\n')
c、a: 只追加写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时不清空文件内容,文件指针跳到文件末尾
# with open('c.txt',mode='at',encoding='utf-8') as f: # f.write('你好阿斯蒂芬\n') # f.write('adfasdf\n') # f.writelines([1,2,3])
2、控制文件读写内容的模式(不能单独使用,必须与r、w、a连用):t(默认) b
a、t(默认):无论读写都是以字符为单位的,只能操作文本文件,必须指定encoding参数;
# with open('a.txt',mode='rt',encoding="utf-8") as f: # data=f.read() # print(data,type(data))
b、b:无论读写都是以bytes为单位的,可以操作所有文件,一定不能指定encoding参数;
# with open('01.mp4',mode='rb') as f: # data=f.read() # print(data,type(data)) # with open('a.txt',mode='wb') as f: # f.write('字符行啊士大夫阿斯蒂芬撒旦发'.encode('utf-8'))
3、+:不能单独使用,必须与r、w、a连用,r+ w+ a+ 可实现功能拓展 但是用处不大 (了解知识点)。
三、文件修改的两种方式:
1、方式一:
-
以读的方式打开源文件;
-
将文件内容一次性全读入内存,在内存完成修改;
-
以写的方式打开源文件,然后将修改后的结果一次性写入源文件。
总结:
优点:在文件修改过程中硬盘只存在一份数据。
缺点:浪费内存。
#方式一的修改代码 with open('b.txt',mode='rt',encoding='utf-8') as f1: msg=f1.read() new_msg=msg.replace('alex','大SB') with open('b.txt',mode='wt',encoding='utf-8') as f2: f2.write(new_msg)
2、方式二:
-
以读的方式打开源文件,以写的方式打开一个临时文件;
-
读取源文件的一行内容到内存中,将修改的结果写入临时文件,循环往复直到改;
-
删除源文件,将临时文件重命名为源文件名。
总结:
优点:同一时间在内存中只有文件的一行内容,更节省内容。
缺点:在文件修改过程中硬盘只存在两份数据。
# 方式二修改代码 import os #模块操作 with open('b.txt',mode='rt',encoding='utf-8') as read_f,\ open('.b.txt.swap',mode='wt',encoding='utf-8') as write_f: for line in read_f: write_f.write(line.replace('大SB','alex')) os.remove('b.txt') os.rename('.b.txt.swap','b.txt') # '.b.txt.swap'临时的被覆盖文件的一种常用写法