Python(day5)文件操作
一、文件处理流程
- 打开文件,得到文件句柄并赋值给一个变量
- 通过句柄对文件进行操作
- 关闭文件
二、文件打开模式
打开文件时,需要指定文件路径和以何等方式打开文件,打开后,即可获取该文件句柄,日后通过此文件句柄对该文件操作。
打开文件的模式有:
- r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】
- w,只写模式【不可读;不存在则创建;存在则清空内容】
- x, 只写模式【不可读;不存在则创建,存在则报错】
- a, 追加模式【可读; 不存在则创建;存在则只追加内容】
"+" 表示可以同时读写某个文件
- r+, 读写【可读,可写】
- w+,写读【可读,可写】
- x+ ,写读【可读,可写】
- a+, 写读【可读,可写】
"b"表示以字节的方式操作
- rb 或 r+b
- wb 或 w+b
- xb 或 w+b
- ab 或 a+b
注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
#r模式,默认模式,文不存在则报错 1 ) f = open ( 'a.txt' ,encoding = 'utf-8' ) print ( 'first-read:' ,f.read()) #读文件所有内容 print ( 'seconde-read: ' ,f.read()) #光标在最后一行,第二个打印读不出内容 2 ) f = open ( 'a.txt' ,encoding = 'utf-8' ) print (f.readline(),end = '') #读文件一行 print (f.readline(),end = '') print (f.readlines()) #读出文件所有行 f.close() #关闭文件 |
1
2
3
4
5
6
7
8
9
|
#w模式,文不存在则创建,文件存在则覆盖 f = open ( 'a.txt' , 'w' ,encoding = 'utf-8' ) f.write( '1111111\n22222\n3333\n' ) #\n是换行 #也可以这样写 f.writelines([ '111hhh\n' , '222aa2\n' , '3333\n' ]) f.close() |
1
2
3
4
5
|
#a模式,文不存在则创建,文件存在不会覆盖,写内容是追加的方式写 f = open ( 'a.txt' , 'a' ,encoding = 'utf-8' ) f.write( '\n444444\n' ) f.write( '5555555\n' ) f.close() |
1
2
3
4
5
6
7
|
#其他方法 # f=open('a.txt','w',encoding='utf-8') # f.write('asdfasdf') # f.flush() #把内存数据刷到硬盘 # f.close() # print(f.closed) #判断文件是否关闭 # f.readlines() |
三、文件内置函数flush
flush原理:
- 文件操作是通过软件将文件从硬盘读到内存
- 写入文件的操作也都是存入内存缓冲区buffer(内存速度快于硬盘,如果写入文件的数据都从内存刷到硬盘,内存与硬盘的速度延迟会被无限放大,效率变低,所以要刷到硬盘的数据我们统一往内存的一小块空间即buffer中放,一段时间后操作系统会将buffer中数据一次性刷到硬盘)
- flush即,强制将写入的数据刷到硬盘
四、open函数详解
1. open()语法
open(file[, mode[, buffering[, encoding[, errors[, newline[, closefd=True]]]]]])
open函数有很多的参数,常用的是file,mode和encoding
file文件位置,需要加引号
mode文件打开模式,见下面3
buffering的可取值有0,1,>1三个,0代表buffer关闭(只适用于二进制模式),1代表line buffer(只适用于文本模式),>1表示初始化的buffer大小;
encoding表示的是返回的数据采用何种编码,一般采用utf8或者gbk;
errors的取值一般有strict,ignore,当取strict的时候,字符编码出现问题的时候,会报错,当取ignore的时候,编码出现问题,程序会忽略而过,继续执行下面的程序。
newline可以取的值有None, \n, \r, ”, ‘\r\n',用于区分换行符,但是这个参数只对文本模式有效;
closefd的取值,是与传入的文件参数有关,默认情况下为True,传入的file参数为文件的文件名,取值为False的时候,file只能是文件描述符,什么是文件描述符,就是一个非负整数,在Unix内核的系统中,打开一个文件,便会返回一个文件描述符。
2. Python中file()与open()区别
两者都能够打开文件,对文件进行操作,也具有相似的用法和参数,但是,这两种文件打开方式有本质的区别,file为文件类,用file()来打开文件,相当于这是在构造文件类,而用open()打开文件,是用python的内建函数来操作,建议使用open
五、上下文管理
1
2
3
4
5
6
7
8
9
10
11
12
|
#上下文管理with # read_f=open('a.txt','r',encoding='utf-8') # write_f=open('.a.txt.swp','w',encoding='utf-8') #上面两句可以缩写成下面一句 with open ( 'a.txt' , 'r' ,encoding = 'utf-8' ) as read_f,\ open ( '.a.txt.swp' , 'w' ,encoding = 'utf-8' ) as write_f: for line in read_f: if 'alex' in line: line = line.replace( 'alex' , 'ALEXSB' ) write_f.write(line) os.remove( 'a.txt' ) os.rename( '.a.txt.swp' , 'a.txt' ) |