Python基础（十六）：文件读写

文件读写的流程

类比windows中手动操作txt文档，说明python中如何操作txt文件？

windows中手动操作txt文件的步骤
1. 找到txt文件
2. 打开txt文件
3. 查看（或操作）文件中的内容
4. 关闭txt文件
python操作txt文件的步骤
1. 获取被打开的文件的内存对象，该内存对象有被叫做文件句柄
2. 通过这个内存对象（文件句柄），来对文件进行操作（读取，写入等操作）
3. 关闭文件

什么是文件的内存对象(文件句柄)？

使用python读取一个txt文件的时候，相对于把这个文件从硬盘上，读取到了内存中。

我们如果想要操作这个文件，是不是先要获取这个文件对象？只有获取这个文件对象后，才能够真正的去操作这个文件，不管是读取文件中的内容，还是向文件中写入内容。

这个文件句柄包含了文件的文件名、文件的字符集、文件的大小、文件在硬盘上的起始位置。

演示怎么读取文件

① 演示如下

f = open(r"D:\python_project\mxxl\test.txt", "r", encoding="utf-8")
data = f.read()
print(data[:245])
f.close()

结果如下：

② 一个很奇怪的现象？

f = open(r"D:\python_project\mxxl\test.txt", "r", encoding="utf-8")
data = f.read()
data1 = f.read()
print(data[:245])
print("-------------------------------------")
print(data1[:245])
f.close()

结果如下：

问题：我们读取了2遍内容，为什么只显示了一次读取的结果呢？对于上述问题，我们用一张图回答上述问题。

通过上图我们可以发现，当我们操作这个文件句柄的read()方法去读取文件的时候，这个句柄会从文件的开头位置1，移动到文件的结束位置2。

如果不做任何操作，读取完毕之后，句柄就会停止在2这个位置。因此当我们再次读取文件的时候，该句柄是从2这个位置，往后面读取内容。由于后面没有任何内容，因此第二次读取为空。

那么，如果我们想要第二次同样能够读取到文件中的内容，应该怎么办呢？那么接着往下看。

演示怎么写文件

f = open(r"D:\python_project\mxxl\test2.txt","w",encoding="utf-8")
f.write("我爱北京天安门")
f.close()

结果如下：

假如我们在写一句天安门上太阳升，会出现啥情况呢？

f = open(r"D:\python_project\mxxl\test2.txt","w",encoding="utf-8")
f.write("天安门上太阳升")
f.write("很好，很好")
f.close()

结果如下：

意外发生：当我们再次写入新的内容的时候，发现之前写的内容不见了，这是为啥呢？这就是我们下面要讲述的文件读写的几种常见模式。

文件读写的几种常见模式

模式	可做操作	若文件不存在	是否覆盖源文件
r	只能读	报错	-
r+	可读可写	报错	是
w	只能写	创建	是
w+	可读可写	创建	是
a	只能写	创建	否。追加写
a+	可读可写	创建	否。追加写

关于r+、w+、a+使用说明(易错点)

当我们读取某个文件，向文件中写入某些内容(覆盖写)，向文件中追加写入某写内容时，最好的方式就是分别使用r、w、a这三种模式。对于这三种模式，要么读，要么写，读模式就不能写，写模式就不能读。

对于r+、w+、a+这三种模式，如果你不是特别清楚python文件读写的原理，就不要轻易使用，因为会出现很多问题，下面我们仅演示r+、 w+，a+这三种模式。

r+模式：可读可写

对于这种模式，不管是读取文件中的内容，还是朝文件中写入内容。前提条件：文件存在。

# 只读取文件中的内容
f = open(r"D:\python_project\mxxl\test\test.txt", "r+", encoding="utf-8")
data = f.read()
print(data)
f.close()

# 朝文件中写入内容后，立即读取，会出现啥问题？
f = open(r"D:\python_project\mxxl\test\test.txt", "r+", encoding="utf-8")
f.write("黑姑娘")
data = f.read()
print(data)
f.close()

# 朝文件中写入内容后，调整句柄位置后，再读取，会出现啥问题？
f = open(r"D:\python_project\mxxl\test\test.txt", "r+", encoding="utf-8")
f.write("黑姑娘")
f.seek(0)
data = f.read()
print(data)
f.close()

结果如下：

使用r+模式，当只读文件的时候，可以读取到其中的内容。

当写入内容后，立即读取文件内容，发现什么也读取不到。这是由于当你写入内容后，文件句柄会放在写入内容的最后面，因此当你立即读取的时候，句柄会从上次内容最后的位置，往后面读，因此读取为空。

当朝文件中写入内容后，调整句柄位置后，再读取文件中的内容，发现就有了内容。这是由于我们使用了f.seek(0)方法，将句柄由内容末尾调整到了内容开头，因此就又有了内容。

w+：可读可写

# 直接往文件中写入内容
f = open(r"D:\python_project\mxxl\test\test.txt", "w+", encoding="utf-8")
f.write("bbbbbb")
f.close()

# 直接读取上述文件，看看会发生啥问题？(特别注意这一步)
f = open(r"D:\python_project\mxxl\test\test.txt", "w+", encoding="utf-8")
data = f.read()
print(data)
f.close()

# 朝文件中写入内容后，立即读取，又会发生什么？
f = open(r"D:\python_project\mxxl\test\test.txt", "w+", encoding="utf-8")
f.write("哈哈哈哈哈")
data = f.read()
print(data)
f.close()

# 朝文件中写入内容后，调整句柄位置后，再读取，会发生什么？
f = open(r"D:\python_project\mxxl\test\test.txt", "w+", encoding="utf-8")
f.write("嘿嘿嘿嘿嘿")
f.seek(0)
data = f.read()
print(data)
f.close()

结果如下：

使用w+模式，当我们直接朝文件中写入bbbbbb，毋庸置疑，肯定是可以的。

接着，我们直接读取这个文件中的内容，奇怪的现象发生了，什么都读取不到。这是因为w+模式，在进行文件读取的时候，默认是先写再读。但是我们确实没有写入任何东西呀？这是由于系统默认帮我们写入了一个空值，因此把原有内容覆盖了。所以再当我们读取文件中的内容的时候，发现读取为空。

再接着，我们朝文件中，写入内容后再立即读取，这下仍然读取不到任何内容，这又是为什么呢?这是由于我们第一次写入"哈哈哈哈哈哈"的时候，句柄移动到了内容最后。当我们立即读取的时候，句柄从内容最后的位置，继续朝后面读，因此啥也没有。

a+：可读可写

# 直接朝文件中写入内容
f = open(r"D:\python_project\mxxl\test\test.txt", "a+", encoding="utf-8")
f.write("哈哈")
f.close()

# 直接读取文件中的内容
f = open(r"D:\python_project\mxxl\test\test.txt", "a+", encoding="utf-8")
data = f.read()
print(data)
f.close()

# 调整句柄位置后，再读取文件中的内容
f = open(r"D:\python_project\mxxl\test\test.txt", "a+", encoding="utf-8")
f.seek(0)
data = f.read()
print(data)
f.close()

结果如下：

使用a+模式，朝文件中写入内容，毋庸置疑，肯定是没问题的。

接着，当我们读取上述文件中的内容，会发现什么也读取不到。这是由于，使用r+模式打开文件，文件句柄默认放在内容的最后面，因此你直接读取其中的内容，什么也没有。

最后，在读取文件中内容之前，我们使用了f.seek(0)方法，将句柄由内容末尾调整到了内容开头，再次读取文件中的内容，发现就有了内容。

read、readline、readlines的区别

方法	读取内容	是否读取末尾换行符	返回值
read()	一次性读取所有内容	不会	返回的是一整个内容的字符串
readline()	一行一行的读取文件中的内容	会	返回的每一行也是一个字符串
readlines()	一次性读取所有内容部	会	返回一整个内容列表

read()方法的使用说明

f = open(r"D:\python_project\mxxl\test\test.txt","r",encoding="utf-8")
data = f.read()
print(type(data))
print(data)
f.close()

结果如下：

readline()方法的使用说明

f = open(r"D:\python_project\mxxl\test\test.txt","r",encoding="utf-8")
data = f.readline()
print(type(data))
print(data)
f.close()

f = open(r"D:\python_project\mxxl\test\test.txt","r",encoding="utf-8")
for i in range(3):
	data = f.readline()
	print(data)
f.close()

结果如下：

去掉每一行末尾的换行符：

f = open(r"D:\python_project\mxxl\test\test.txt","r",encoding="utf-8")
for i in range(3):
	data = f.readline().strip()
	print(data)
f.close()

结果如下：

readlines()方法的使用说明

f = open(r"G:\6Tipdm\file_read_write\test.txt","r",encoding="utf-8")
data = f.readlines()
print(type(data))
print(data)
f.close()

结果如下：

对于一个10G的大文件，怎么高效的查看文件中的内容呢？

操作说明

f = open(r"D:\python_project\mxxl\test\test.txt","r",encoding="utf-8")
for line in f:
	print(line.strip())

部分截图如下：

上述方式中，f相当于一个迭代器，我们使用for循环迭代f中元素。每循环一次，就相当于读取一行到内存中，并记住这一次读取到的位置。当进行下次迭代的时候，上一次读取到内存中的内容，就会被销毁了，当前内存中读取的就是第二行的内容。当进行第三次循环的时候，内存中第二行的内容也会被销毁，此时内存中只会保存第三行的内容，这样依次进行下去。直到最后一次循环，读取最后一行的内容，此时，内存中保留的也只是最后一行的内容。

送代器有一个特性：每次进行迭代的时候，就会记住当前读取的位置。当进行下一次法1代的时候，前面的内容会被销毁掉，在内存中只会保留当前循环得到的内容。

with语法

# with 语法 自动关闭文件 相当于帮你执行了fp.close()

with open(r'test.txt','r',encoding='utf-8') as f:
	data = f.read()
	print(data)

结果如下：

posted @ 2021-04-11 16:41 pure3417 阅读(218) 评论(0) 收藏举报

刷新页面返回顶部

pure3417

Python基础（十六）：文件读写

文件读写的流程

类比windows中手动操作txt文档，说明python中如何操作txt文件？

什么是文件的内存对象(文件句柄)？

演示怎么读取文件

演示怎么写文件

文件读写的几种常见模式

关于r+、w+、a+使用说明(易错点)

r+模式：可读可写

w+：可读可写

a+：可读可写

read、readline、readlines的区别

read()方法的使用说明

readline()方法的使用说明

readlines()方法的使用说明

对于一个10G的大文件，怎么高效的查看文件中的内容呢？

相关说明

操作说明

with语法

公告