Python3 文件操作
一、文件操作
使用python来读写文件使用open()函数来打开一个文件,获取到文件句柄,然后通过文件句柄就可以进行各种操作了。根据打开方式不同能够执行的操作也有差异。
打开文件的方式:r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b默认使用的是r(只读)模式
二、只读操作(r, rb)
file = open("文件名", mode="r", encoding="utf-8") content = file.read() print(content) file.close()
要注意encoding表示编码集
rb读取出来的数据是bytes类型,在rb模式下,不能选择encoding字符集
file = open("文件名", mode="rb") content = file.read() print(content) file.close()
rb的作用是在读取非文本文件的时候,比如读取音视频等信息的时候就要用到rb
读取文件的方法:
1.read()将文件中的内容全部读取出来;占内存。如果文件过大,容易导致内存崩溃
2.read(n)读取n个字符;注意,如果再次读取就会在当前位置继续去读而不是从头读,如果是rb模式则读取出来的是n个字节
3.readline()一次读取一行数据,每次读取出来的数据结尾都会有一个\n,所以要使用strip()方法来去掉\n或者空格
4.readlines()将每一行形成一个元素,放到一个列表中;将所有内容都读取出来,所以也是占内存大
5.循环读取,这是最建议使用的方式,每次读取一行内容。
注意:读取完的文件句柄一定要关闭 f.close()
三、写模式(w, wb)
写的时候,如果没有文件,则会创建文件,如果文件存在,则将原来文件中原内容删除,再写入新内容
file = open("文件名", mode="w", encoding="utf-8") file.write("写内容") file.flush() file.close()
wb模式下可以不指定打开文件的编码,但是在写文件的时候必须将字符串转化成utf8的bytes数据
file = open("文件名", mode="wb") file.write("写内容".encode("utf-8")) file.flush() file.close()
四、追加(a, ab)
在追加模式下,我们写入的内容会追加在文件结尾
五、读写模式(r+, r+b)
对于读写模式,必须是先读,因为默认光标是在开头的,准备读取的;当读完了之后再进行写入,使用频率最高的模式就是r+
file = open("文件名", mode="r+", encoding="utf-8") content = file.read() file.write("写内容") print(content) file.flush() file.close()
六、写读(w+, w+b)
先将所有的内容清空,然后写入,最后读取,但是读取的内容是空的,不常用。
file = open("文件名", mode="w+", encoding="utf-8") file.write("写内容") content = file.read() print(content) file.flush() file.close()
七、追加读(a+)
a+模式下,不论先读还是后读,都读取不到数据;
八、其他相关操作
1.seek(n)光标移动到n位置,注意,移动的单位是byte,所以如果是utf-8的中文部分要是3的倍数。
通常我们使用seek都是移动到开头或者结尾
移动到开头:seek(0)
移动到结尾:seek(0,2)
seek的第二个参数表示的是从哪个位置进行偏移,默认是0表实从开头,1表示当前位置,2表示结尾
file = open("文件名", mode="r+", encoding="utf-8") file.seek(0) # 光标移动到开头 content = file.read() # 读取内容,此时光标移动到结尾 print(content) file.seek(0) # 再次将光标移动到开头 file.seek(0,2) # 将光标移动到结尾 content2 = file.read() # 读取内容,什么都没有 print(content2) file.seek(0) # 移动到开头 file.write("新写内容") # 写入信息,此时光标在9,中文3*3 file.flush() file.close()
2.tell() 可以获取到当前光标在什么位置
file = open("文件名", mode="r+", encoding="utf-8") file.seek(0) # 光标移动到开头 content = file.read() # 读取内容,此时光标移动到结尾 print(content) file.seek(0) # 再次将光标移动到开头 file.seek(0,2) # 将光标移动到结尾 content2 = file() # 读取内容,什么都没有 print(content2) file.seek(0) file.write("写内容") print(file.tell()) # 光标位置 file.flush() file.close()
3.truncate()截断文件
如果想做截断的时候,要先移动光标,挪动到想要截断的位置再进行截断;
truncate(n),如果给出了n,则从开头进行截断,如果不给n,则从当前位置截断,后面的内容将会被删除;
注意:在r+模式下,如果读取了内容,不论读取内容多少,光标显示的是多少,再写入或者操作文件的时候都是再结尾进行的操作。
九、修改文件以及另一种打开文件的方式
文件修改只能将文件中的内容读取到内存中,将信息修改完毕后再将源文件删除,将新文件的名字改成老文件的名字
import os with open("文件名", mode="r", encoding="utf-8") as file1,\ open("文件名_new", mode="w", encoding="UTF-8") as file2: for line in f1: new_line = line.replace("大白梨", "冰糖葫芦") file2.write(new_line) os.remove("文件名") # 删除源⽂文件 os.rename("文件名_new", "文件名") # 重命名新⽂文件