【python】 文件相关操作
使用python进行读写文件时非常简单的事,我们使用open()函数来打开一个文件,获取到文件句柄,通过句柄就可以进行各种各样的操作了,根据打开方式的不同能够执行的操作也会有相应的差异.
什么是句柄:
句柄,从广义上,能够以一个数值拎起一大堆数据的东西都可以叫做句柄。句柄的英文是"Handle",本义就是"柄",只是在计算机科学中,被特别地翻译成"句柄",其实还是个"柄"。以一个小东西拎起一大堆东西,这难道不像是个"柄"吗?如果想更深刻的理解句柄的概念和含义,我给大家推荐一篇博文https://blog.csdn.net/rongwenbin/article/details/19820829
举个栗子: 句柄其实就是变量
打开文件的方式: r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b 默认使用的事r(只读)模式.
文件操作的基本格式: open("文件名路径",mode="打开方式",encoding="编码方式"),值得注意的是,这里的文件名是单纯的文件名,就是你ctrl+s保存之后输入的文件名,不需要加后缀名。打开之后需要用一个变量来接收。在这里还涉及到一个路径的问题
绝对路径: 从磁盘根目录开始一直到文件名.
相对路径: 同一个文件夹下的文件.相对于当前这个程序所在的文件夹而言,如果在同一个文件夹,相对路径就是文件名,如果在上一层文件夹,则要../
相比较而言,更推荐大家使用相对路径,因为我们在把程序拷贝给别人时,直接把项目拷贝走就可以使用,但是如果使用绝对路径,那还需要拷贝外部的文件
1. r模式(只读):
f = open("护士少妇嫩模",mode="r", encoding="utf-8") content = f.read() print(content) f.close()
读取文件的方式:
1. read(),这是将文件内容一次性全部读取出来,但是缺点就是占内存,如果文件过大的话,容易导致内存崩溃;
2. read(n),这是读取n个字符.需要注意的是,如果再次读取的话,那么会在当前位置继续去读取而不是从头开始读取,试过是rb模式,那读取之后就是n个字节
3.readline(),这是一次读取一行数据,注意: readline()结尾,每次都会有一个\n,所以需要我们使用strip()方法来去除空格或者\n
4. readlines(),这是将每一行形成一个元素,放在列表里,将所有的内容都读取出来,所以这个读取方式也容易出现内存崩溃的问题
5.循环读取,这种方式是组好的. 每次读取一行内容,不会产生内存溢出的问题.
注意: 读取完的句柄一定要关闭: f.close()
2. w模式(只写):
f = open("护士少妇嫩模",mode="w", encoding="utf-8") content = f.write("护士少妇嫩模,大家都喜欢") print(content) f.close()
w模式,如果文件不存在的话,则会创建文件,如果文件存在,则将原文件的内容全部删除,再写入新的内容
3. a模式(追加):
f = open("护士少妇嫩模",mode="a", encoding="utf-8") content = f.write("护士少妇嫩模,大家都喜欢") print(content) f.close()
4. r+模式(读写):
f = open("小娃娃", mode="r+", encoding="utf-8")
content = f.read()
f.write("麻花藤的最爱")
print(content)
f.flush()
f.close()
5. w+模式(写读):
f = open("小娃娃", mode="w+", encoding="utf-8") f.write("哈哈") content = f.read() print(content) f.flush() f.close()
6. a+模式(追加读)
f = open("小娃娃", mode="a+", encoding="utf-8") f.write("马化腾") content = f.read() print(content) f.flush() f.close()
7. 其他操作
1. seek(n) 光标移动到n位置, 注意, 移动的单位是byte. 所以如果是UTF-8的中文部分要是3的倍数.
通常我们使用seek都是移动到开头或者结尾.
移动到开头: seek(0)
移动到结尾: seek(0,2)
seek的第二个参数表示的是从哪个位置进行偏移, 默认是0, 表示开头, 1表示当前位置, 2表示结尾
f = open("小娃娃", mode="r+", encoding="utf-8") f.seek(0) # 光标移动到开头 content = f.read() # 读取内容, 此时光标移动到结尾 print(content) f.seek(0) # 再次将光标移动到开头 f.seek(0, 2) # 将光标移动到结尾 content2 = f.read() # 读取内容. 什么都没有 print(content2) f.seek(0) # 移动到开头 f.write("张国荣") # 写入信息. 此时光标在9 中文3 * 3个 = 9 f.flush() f.close()
2. tell() 使⽤用tell()可以帮我们获取到当前光标在什么位置
3. truncate() 截断文件
f = open("小娃娃", mode="w", encoding="utf-8") f.write("哈哈") # 写入两个字符 f.seek(3) # 光标移动到3, 也就是两个字中间 f.truncate() # 删掉光标后面的所有内容 f.close() f = open("小娃娃", mode="r+", encoding="utf-8") content = f.read(3) # 读取12个字符 f.seek(4) print(f.tell()) f.truncate() # 后面的所有内容全部都删掉 # print(content) f.flush() f.close()
所以如果想做截断操作. 记住了. 要先挪动光标. 挪动到你想要截断的位置. 然后再进行截断 .关于truncate(n), 如果给出了n. 则从开头进行截断, 如果不给n, 则从当前位置截断. 后面的内容将会被删除
8. 文件修改
文件修改: 只能将文件中的内容读取到内存中, 将信息修改完毕, 然后将源文件删除, 将新文件的名字改成老文件的名字.
import os with open("小娃娃", mode="r", encoding="utf-8") as f1,\ open("小娃娃_new", mode="w", encoding="UTF-8") as f2: for line in f1: new_line = line.replace("大白梨梨", "冰糖葫芦") f2.write(new_line) os.remove("小娃娃") # 删除源⽂文件 os.rename("小娃娃_new", "小娃娃") # 重命名新文件