文件操作函数及光标,tell,truncate
一丶文件基本操作
1.打开文件
open(文件名(路径),mode = "?",encoding = "字符集")
2.文件路径:
1.绝对路径,从磁盘的根目录寻找,或者从互联网上寻找一个路径
f = open("e:/abc/里皮.txt",mode = "r".encoding = "gbk") s = f.read() print(s) f.close()
2.相对路径,相对于当前程序所在的文件夹
../ 返回上一级 f = open("../abc/晓峰",mode = "r",encoding="gbk") s = f.read() print(s) f.close()
3.创建新文件. 把修改后的内容写入新文件. 删除老文件. 重命名新文件
import os os.remove("")删除文件 os.rename("源文件", "新文件名") 重命名文件 for line in f: line 一行数据 with open("文件名") as f: 不需要关闭文件句柄
二丶文件操作
1.初识文件操作
1.使用python来读写文件是非常简单的操作,我们使用open()函数来打开一个文件,获取到文件句柄,然后通过文件句柄就可以进行各种各样的操作了,根据打开方式的不同能够执行的操作也会有相应的差异
2.打开文件的方式:r(只读),w(只写),a(追加),r+(读写),w+(写读),a+(追加写读),rb(只读),wb(只写),ab(追加),r+b,w+b,a+b默认使用的是r(只读模式)
2.只读操作(r,rb)
r:
f = open("小护士.txt",mode="r",encoding="utf-8") #打开小护士.txt文件 编码集为utf-8 content = f.read() #只读 print(content) f.close #关闭
rb:
f = open("小护士.txt",mode="rb") content = f.read() print(content) f.close
结果:
b'\xe4\xbd\xa0\xe6\x98\xaf\xe4\xb8\xaa\xe5\x82\xbb\xe5\xad\x90\xe5\x90\x97?'
rb的作用:在读取非文本文件的时候,比如读取MP3.图像.视频等信息的时候就需要用到rb,因为这种数据是没办法直接显示出来的,在后面我们文件上传下载的时候还会用到,还有我们看到的直播都是这种数据.
3.写模式(w,wb)
写的时候注意,如果没有文件,则会创建文件,如果文件存在,则将原件中原来的内容删除,再写入新内容
f = open("小护士.txt",mode="rb") content = f.read() print(content) f.close f = open("小娃娃",mode="w",encoding="utf-8") f.write("金毛狮王") #写入"金毛狮王" # f.read() #模式是w ,不可执行读操作 f.flush() #刷新 f.close()
wb模式下,可以不指定打开文件的编码,但是在写文件的时候必须将字符串转化成utf-8的bytes数据
f = open("小娃娃",mode="wb") f.write("金毛狮王".encode("utf-8")) #wb模式下,可以不指定打开文件的编码,但是在写文件的时候必须将字符串转化成utf-8的bytes数据 f.flush() f.close()
4.追加(a,ab)
追加模式下,我们写入的内容会追加在文件的末尾
f = open("小娃娃",mode="a",encoding="utf-8") f.write("麻花藤的最爱") f.flush() f.close()
5.读写模式(r+,r+b)
对于读写模式,必须是先读,因为默认光标是在开头的,准备读取的,当读完了之后再进行写入
f = open("小娃娃",mode="r+",encoding="utf-8") content = f.read() f.write("麻花藤的最爱") print(content) f.flush() f.close()
6.写读(w+,w+b)
#先将所有的内容清空,然后写入最后读取,但是读取的内容是空的,不常用 f = open("小娃娃",mode="w+",encoding="utf-8") f.write("哈哈") #将哈哈写入 content = f.read() #已经被清空了 print(content) f.flush() f.close()
7.追加读(a+)
#a+模式下,不论先读还是后读,都是读取不到数据的 f = open("小娃娃",mode="a+",encoding="utf-8") f.write("麻花藤") #哈哈麻花藤 content = f.read() print(content) f.flush() f.close()
8.读取文件的方法:
1.read()将文件的内容全部读取出来,弊端;占内存,如果文件过大,容易导致崩溃
f = open("哇卡.txt",mode="r",encoding = "utf-8") content = f.read() print(content)
2.read(n)读取n个字符,需要注意的是,如果再次读取,那么会在当前位置继续读而不是从头读,如果使用的是rb模式,则读取出来的是n个字节
f = open("哇卡.txt",mode="r",encoding="utf-8") content = f.read(3) #可以形 print(content)
3.readline()一次读取一行数据,注意:readline()结尾,注意每次读取出来的数据都会有一个\n,所以呢,需要我们使用strip()方法来去掉\n或者空格
f = open("哇卡.txt",mode="r",encoding="utf-8") content = f.readline() content2 = f.readline() content3 = f.readline() content4 = f.readline() content5 = f.readline() content6 = f.readline() print(content) print(content2) print(content3) print(content4) print(content5) print(content6)
4.readlines()将每一行形成一个元素,放到一个列表中,将所有的内容都读取出来,所以也是容易出现内存崩溃的问题,不推荐使用
f = open("哇卡.txt",mode="r",encoding="utf-8") lst = f.readline() print(lst) for line in lst: print(line.strip())
5.循环读取,这种方式是最好的,每次读取一行内容,不会产生内存溢出的问题
f = open("哇卡.txt",mode="r",encoding="utf-8") for line in f: print(line.strip())
三丶其它相关操作
1.seek()
seek(n) 光标移动到n位置,注意,移动的单位是byte.所以如果是UTF-8的中文部分要是3的倍数.
通常我们使⽤seek都是移动到开头或者结尾.
移动到开头: seek(0)
移动到结尾: seek(0,2) seek的第⼆个参数表示的是从哪个位置进行偏移, 默认是0, 表示开头, 1表示当前位置, 2表示结尾
f = open("小娃娃",mode="r+",encoding="utf-8") f.seek(0) #光标移动到开头 content = f.read() #读取内容,此时光标移动到结尾 print(content) f.seek(0) #再次将光标移动到开头 f.seek(0,2) #将光标移动到结尾 content2 = f.read() #读取内容,什么都没有 print(content2) f.seek(0) #移动到开头 f.write("张国荣") #写入信息,此时光标在9 中文3*3个 = 9 f.flush() f.close()
2.tell()使用tell()可以帮我们获取到当前光标在什么位置
f = open("小娃娃",mode="r+",encoding="utf-8") f.seek(0) #光标移动到开头 content = f.read() #读取内容,此时光标移动到结尾 print(content) f.seek(0) #再次将光标移动到开头 f.seek(0,2) #将光标移动到结尾 content2 = f.read() #读取内容,什么都没有 print(content2) f.seek(0) #移动到开头 f.write("张国荣") #写入信息,此时光标在9 中文3*3个 = 9 f.flush() f.close() f = open("小娃娃",mode="r+",encoding="utf-8") f.seek(0) #光标移动到开头 content = f.read() #读取内容,此时光标移动到结尾 print(content) f.seek(0) #再次将光标移动到开头 f.seek(0,2) #将光标移动到结尾 content2 = f.read() #读取内容,什么都没有 print(content2) f.seek(0) #移动到开头 f.write("张国荣") #写入信息,此时光标在9 中文3*3=9 print(f.tell()) #光标位置9 f.flush() f.close()
3.截断文件truncate()
f = open("小娃娃",mode="w",encoding="utf-8") f.write("哈哈") #写入两个字符 f.seek(3) f.truncate() #删除光标后面的所有内容 f.close() f = open("小娃娃",mode="r+",encoding="utf-8") content = f.read(3) #读取12个字符 f.seek(4) print(f.tell()) f.truncate() #后面的所有内容全部都删掉 f.flush() f.close()
深坑请注意:在r+模式下,如果读取了内容,不论读取内容多少,光标显示的是多少,再写入或者操作文件的时候都是在结尾进行的操作
所以如果想做截断操作,记住了,要先挪动光标,挪动到你想要截断的位置,然后再进行截断关于truncate(n),如果给出了n,则从开头进行截断,如果不给n,则从当前位置截断,后面的内容将会被删除
4.修改文件以及另一种打开文件的方式
文件修改:只能将文件中的内容读取到内存中,将信息修改完毕,然后将源文件删除,将新文件的名字改成老文件的名字
import os with open("小娃娃",mode="r",encoding="utf-8") as f1,\ open("小娃娃_new",mode="w",encoding="utf-8") as f2: content = f1.read() new_content = content.replace("冰糖葫芦","大白梨") f2.write(new_content) os.remove("小娃娃") os.rename("小娃娃_new","小娃娃")
弊端:一次将所有内容进行读取,内存溢出,解决方案:一行一行的读取和操作
import os with open("小娃娃",mode="r",encoding="utf-8") as f1 ,\ open("小娃娃_new",mode="w",encoding="utf-8") as f2: for line in f1: new_line = line.replace("大白梨","冰糖葫芦") f2.write(new_line) os.remove("小娃娃") os.rename("小娃娃_new","小娃娃")
---恢复内容结束---