python 小兵(4)之文件操作
文件操作
初始文件操作
使用Python来读写文件是非常简单的操作,我们使用open()函数来打开一个文件,获取到文件句柄,然后通过文件句柄就可以进行各种各样的操作了
根据打开方式的不同能够执行的操作会有相应的差异.
打开文件的方式:
r,w,a
r+,w+,a+
rb,wb,ab
r+b,w+b,a+b
默认使用的是r(只读模式)
只读操作(r/rb)
1
2
3
4
5
6
7
|
f = open ( '护士少妇萝莉' ,mode = 'r' ,encoding = 'utf-8' ) content = f.read() print (content) f.close() 结果: 标题很好 |
上边的内容open()函数打开护士少妇萝莉的文件,然后赋值到一个句柄中,open函数中的mode是对这个文件操作是的一种模式
encoding这个是指定文件中内容的编码集,接下来的操作就完全通过句柄来操作
1
2
3
4
5
6
7
|
f = open ( '护士少妇萝莉' ,mode = 'rb' ) content = f.read() print (content) f.close() 结果: b '\xe6\xa0\x87\xe9\xa2\x98\xe5\xbe\x88\xe5\xa5\xbd' |
rb 读出来的数据是bytes类型,在rb模式下,不能encoding字符集
rb的作用:在读取非文本文件的时候,比如要读取mp3,图像,视频等信息的时候就需要用到rb,因为这种数据是没办法直接显示出来的
在后面我们文件上传下载的时候还会用到.
绝对路径和相对路径
1.绝对路径:从磁盘根目录开始一直到文件名
2.相对路径:用一个文件夹下的文件,相对于当前这个程序所在的文件而言.如果在同一个文件中,则相对路劲就是这个文件名.如果再上一层文件夹则要使用../
如果相对还是不能理解,来看下这列子:
你朋友要来找你,知道你在那个楼那一层但是不知道那个一个屋,现在你朋友来到这个楼里相对他知道的这一层然后开始找你在那个房间
这种操作就是相对路劲,例子中是通过这个楼中的这一层开始寻找,也就是相对于这个楼的某一层
我们更推荐大家使用相对路劲,因为我把这个程序的整个文件发给你的时候,就可以运行,如果使用绝对路径还需要额外的拷贝外部文件给你
读取文件的方法
read()将文件中的内容全部读取出来;弊端 如果文件很大就会非常的占用内存,容易导致内存奔溃
1
2
3
4
5
6
7
8
9
10
11
|
f = open ( 'path1/小娃娃.txt' ,mode = 'r' ,encoding = 'utf-8' ) msg = f.read() f.close() print (msg) 结果: 高圆圆 刘亦菲 张柏芝 杨紫 王菲 |
read()读取的时候指定读取到什么位置,我们指定先读取前三个内容,然后在使用read()进行读取会继续向后读取,而不会从头开始读取
1
2
3
4
5
6
7
8
9
10
11
12
13
|
f = open ( 'path1/小娃娃.txt' ,mode = 'r' ,encoding = 'utf-8' ) msg = f.read( 3 ) msg1 = f.read() f.close() print (msg) print (msg1) 结果: 高圆圆 刘亦菲 张柏芝 杨紫 王菲 |
上边现在使用的是r模式这样读取的就是文字,如果使用rb模式读取出来的就是字节
1
2
3
4
5
6
7
8
9
10
|
f = open ( 'path1/小娃娃.txt' ,mode = 'rb' ) msg = f.read( 3 ) msg1 = f.read() f.close() print (msg) print (msg1) 结果: b '\xe9\xab\x98' b '\xe5\x9c\x86\xe5\x9c\x86\r\n\xe5\x88\x98\xe4\xba\xa6\xe8\x8f\xb2\r\n\xe5\xbc\xa0\xe6\x9f\x8f\xe8\x8a\x9d\r\n\xe6\x9d\xa8\xe7\xb4\xab\r\n\xe7\x8e\x8b\xe8\x8f\xb2' |
read()可以放我们读取多少内容,如果是r模式 read(3)就获取三个字,如果是rb模式 read(3)就获取三个字节
readline()读取每次只读取一行,注意点:readline()读取出来的数据在后面都有一个\n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
|
f = open ( 'path1/小娃娃.txt' ,mode = 'r' ,encoding = 'utf-8' ) msg1 = f.readline() msg2 = f.readline() msg3 = f.readline() msg4 = f.readline() f.close() print (msg1) print (msg2) print (msg3) print (msg4) 结果: 高圆圆 刘亦菲 张柏芝 杨紫 Process finished with exit code 0 |
解决这个问题只需要在我们读取出来的文件后边加一个strip()就OK了
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
f = open ( 'path1/小娃娃.txt' ,mode = 'r' ,encoding = 'utf-8' ) msg1 = f.readline().strip() msg2 = f.readline().strip() msg3 = f.readline().strip() msg4 = f.readline().strip() f.close() print (msg1) print (msg2) print (msg3) print (msg4) 结果: 高圆圆 刘亦菲 张柏芝 杨紫 |
readlines()读取的是每一行,存放到一个列表当中.
1
2
3
4
5
6
7
|
f = open( '小娃娃' ,mode= 'r' ,encoding= 'utf-8' ) msg1 = f.readlines() f.close() print(msg1) 结果: [ '高圆圆\n' , '刘亦菲\n' , '张柏芝\n' , '杨紫' ] |
如果有个较大的文件我们进行读取不推荐使用以下方法:
1
2
|
f = open ( '../path1/弟子规' ,mode = 'r' ,encoding = 'utf-8' ) print (f.read()) #这样就是将文件一次性全部读取到内存中,内存容易奔溃 |
推荐使用的是这种方法:
1
2
3
4
5
6
7
8
|
f = open ( '../path1/弟子规' ,mode = 'r' ,encoding = 'utf-8' ) for line in f: print (line) #这种方式就是在一行一行的进行读取,它就执行了下边的功能 print (f.readline()) print (f.readline()) print (f.readline()) print (f.readline()) |
注意点:读完的文件句柄一定要关闭
写模式(w,wb)
在写文件的时候我们要养成一个写完文件就刷新的习惯. 刷新flush()
1
2
3
4
5
6
|
f = open ( '../path1/小娃娃.txt' ,mode = 'w' ,encoding = 'utf-8' ) f.write( '太白很白' )f.flush() f.close() 结果: 当我选择使用w模式的时候,在打开文件的时候就就会把文件中的所有内容都清空,然后在操作 |
注意点:如果文件不存在使用w模式会创建文件,文件存在w模式是覆盖写,在打开文件时会把文件中所有的内容清空.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
f1 = open ( '../path1/小娃娃.txt' ,mode = 'r' ,encoding = 'utf-8' ) msg = f1.read() print (msg) # 这个是先查看小娃娃文件中有哪些内容 f = open ( '../path1/小娃娃.txt' ,mode = 'w' ,encoding = 'utf-8' ) f.write( '太白很白' )f.flush() f.close() # 这个是对小娃娃文件进行覆盖写操作 f1 = open ( '../path1/小娃娃.txt' ,mode = 'r' ,encoding = 'utf-8' ) msg = f1.read() print (msg) # 查看覆盖写后的内容 |
尝试读一读
1
2
3
4
5
6
7
8
9
|
f1 = open ( '../path1/小娃娃.txt' ,mode = 'w' ,encoding = 'utf-8' ) msg = f1.read() print (msg) 结果: Traceback (most recent call last): File "D:/python_object/path2/test.py" , line 563 , in <module> msg = f1.read() io.UnsupportedOperation: not readable #模式是w,不可以执行读操作 |
wb模式下,不可以指定打开文件的编辑,但是写文件的时候必须将字符串转换成utf-8的bytes数据
1
2
3
4
5
|
f = open ( '../path1/小娃娃.txt' ,mode = 'wb' ) msg = '你好' .encode( 'utf-8' ) f.write(msg) f.flush() # 刷新 f.close() |