文件操作
本节主要内容
1初识文件操作
2只读 r,rb 只写w,wb追加a,ab r+读写,w+写读,a+写读(追加写读)
3其他的操作方法
4文件的修改以及另一种打开文件句柄的方式
主要内容
一初识文件操作
使用py来读写文件是很简单的操作,我们使用open()函数来打开一个文件,获取到文件的句柄,然后通过文件句柄就可以进行各种各样的操作了,根据打开方式的不同能够执行的操作也会有相应的差异 打开文件方式r,w,a,r+,w+,a+,rb,wb,ab,r+b,w+b,a+b默认使用的是r(只读)模式
二只读操作(r,rb)
变量名=open(‘文件夹名’,mode=‘r',encoding=’utf-8‘这个码看情况,一般pycharm也就这样了
新变量名=变量名。read() 这是读就用read 这两个单词还是认识的,写是。。。。
print(新变量名)
变量名。close() 这就是关闭上面的变量
注意encodin表示编码集,根据文件实际弄,只是我们更多的用utf-8
rb读取出来的数据事bytes类型,在rb模式下,不能选择encoding字符集
变量名=open(‘文件名’,mode=‘rb’)
新变量名=f。read()
print(新变量名)
f。closr
结果就是一堆字节
rb的作用:读取非文本文件的时候,比如读取mp3.图像。视频等信息的时候用
绝对路径和相对路径
1绝对路径:从磁盘的根目录开始一直到文件名。
2相对路径:同一文件夹下的文件。相对于当前这个程序所在的文件夹而言。如果在同一个文件夹中,则相对路径就是这个文件名,如果在上一层文件夹。则要。。。/
推荐大家使用相对路径,这样吧程序拷贝给别人的时候,直接把羡慕拷贝走就能运行,如果要绝对路径,就要拷贝外部文件了。
1.read()将文件中的内容全部读取出来,弊端:占内存,如果文件过大,容易导致内存崩溃。
2.read(n)这个N写的是几就读前几个字,再读是从n后面开始读,不是从头开始,rb就是读n个字节
3readline()一次读取一行数据,注意:readline()结尾,注意每次读取出来的数据都会有一个\n
所以呢,需要我们使用 strip()方法来去掉\n或者空格
4.readlines()将每一行形成一个元素,放到一个列表中,将所有的内容都读取出来,所以也是容易内存崩
5.循环读取 这种方式是最好的,每次读取一行内容,不会产生内存溢出的问题。
变量=open(‘文件名’,mode=‘r',encoding=’utf-8‘)
for i(可自定名) in 变量:
i 循环
读取完文件句柄一定要关闭
三 写模式(w,wb)
写的时候注意,如果没有文件,则会创建文件,如果文件存在则把原文件内容删除,再写入新内容
变量=open(‘文件名’,mode=‘w',encoding=’utf-8‘)
变量。write(’想写的‘)
变量。flush() 养成刷新的好习惯
变量。close 关闭也是好习惯
wb模式下。可以不指定打开文件的编码,但在写文件的时候必须将字符串转化成utf-8的bytes数据
变量=open(‘文件名“,mode=”wb“)
变量。write(’想写的”,encoding=“utf-8‘)
刷新 关闭 不推荐这样反正也要写,还是从头就开始
四增加(a,ab)
我们写入的文件会在追加在文件的结尾
变量=open(‘文件名’,mode=‘a’,‘utf-8’)
变量。write(“”)
刷新 关闭
五 读写模式 r+ r+b
对于读写模式,必须是先读,因为默认光标是在开头的,准备读取的,在读取完了之后再进行写入,我们以后使用频率最高的就是r+
变量=(‘文件名’,mode=r+,‘utf-8’)
新变量=变量。read()
变量。write (‘想写的’)
print(新变量) r+模式一定要先读取再写入 这个不管你读几个,写的话永远在最后写,就算修改光标
妈的 r+先写后读也行,就是你写几个光标向后移几个,读的时候按光标走,就算是字符串类型的数字‘1’ utf-8的编码 字节和汉字也不一样,要注意
六 写读(w+,w+b)
先将所有内容都清空,然后写入最后读取,但是读取的内容是空,一般不常用,调节光标可以选择读入,挑光标也没用
七,追加读(a+)
a+模式下无论先读还是后读都是读取不到数据的
还有就是把字符换成字节而已,不赘述了
八,其他相关操作
seek 光标操作 变量。seek(n) 才可以 n代表的是位置 用的是byte 所以使用utf-8的中要是3的倍数
seek(0)移动到开头,seek(0,2)移动到结尾 也可以直接加数字移动的是字节
tell() 变量。tell() 查询光标的位置 这个感觉实在没用
truncate(n) 这个操作比较多,再组合组合前面的给的操作,读取,光标位置什么的
这个n是数字,不管怎么切,都是从头切,这个n和光标一样都是移动的字节。
想要再读取截断后的段落,移动光标为0,否则一直读取原文件,原文件读取完毕也不读取新文件
截断会截到目标位置或光标位置
九修改文件
只能将文件中的内容读取到内存中,将信息修改完毕,将原文件删除,把新文件的名改成老文件
import os
with open(‘文件名’,mode=‘r',encoding=‘utf-8’)as f1\
open(‘文件名2’,mode=‘w',encoding=‘utf-8’)as f2:
变量名=f.read()
新变量名=变量。replace(‘ ’, “”)
f2。write(新变量名)
os。remove(‘文件名’)
os。rename(‘新变量名‘,一般就是老名——副本,‘文件名’)把新名字改回去