Python Linux系统管理之文件读写

准备工作

1、安装Ipython（请见”Ipython的安装”）

2、实验用的文档（你自己用vi编辑器创建文件就好了）

一、Python内置的Open函数

在Python中，要对应文件进行操作，只要使用内置的Open函数打开文件即可。Open函数接受文件名和打开模式作为参数，返回一个文件对象。工程师通过文件对象来操作文件，完成以后，调用文件对象的close方法关闭文件即可。

例如，在当前目录下有一个名为data的文件，它的内容如下：

[root@master ~]# cat data 
Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.

接下来，使用Open函数打开文件，调用文件对象的read方法读取文件的所有内容，完成以后，调用文件对象的close方法关闭文件，如下所示：

In [3]: f = open('data')                                                                                                                                                

In [4]: print(f.read())                                                                                                                                                 
Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
In [5]:  f.close()

与其他编程语言类似，open函数默认以’r’模式打开，也可以指定文件的打开模式，如表所示。

表文件的打开模式

下面代码分别演示，打开一个不存在的文件时’w’模式与’x’模式的区别：

In [7]: f = open('data1.txt','w')                                                                                                                                       

In [8]: f.write('Hello World')                                                                                                                                          
Out[8]: 11

In [9]: f.close()                                                                                                                                                       

In [10]: f = open('data1.txt','x')                                                                                                                                      
---------------------------------------------------------------------------
FileExistsError                           Traceback (most recent call last)
<ipython-input-10-fc8069bb2b02> in <module>
----> 1 f = open('data1.txt','x')

FileExistsError: [Errno 17] File exists: 'data1.txt'

In [11]:                                                                                                                                                                

In [11]:

In [11]: f = open('data2.txt','x')                                                                                                                                      

In [12]: f.write('Hello World')                                                                                                                                         
Out[12]: 11

In [13]:                                                                                                                                                                

In [13]: f.close()                                                                                                                                                      

In [14]:

二、避免文件句柄泄露

在计算机程序中，每打开一个文件就需要占用一个文件句柄，而一个进程拥有文件的句柄是有限的。此外，文件句柄也会占用操作系统的资源，因此，在编写程序处理文件时需要注意，文件处理结束后及时关闭文件。文件句柄泄露或许是最常见的资源泄露问题，用finally关闭文件句柄。在Python中，也可以使用finally语句来保证，无论在什么情况下文件都会被关闭，如下所示：

try:
f = open(‘data.txt’)
print(f.read())
finally:
f.close()

Python中还有更加简洁优美的写法，即使用上下文管理器。虽然使用finally语句能够保证资源一定关闭，但是没有上下文管理器简洁好用。如果工程师可以在上下文管理器的情况下，使用了Finally语句，将会认为代码写的不够Pythonic。对于文件打开、处理、再关闭的逻辑，使用上下文管理器代码如下：

with open(‘data.txt’) as f:
print(f.read())

可以看到，使用上下文管理器以后代码行数变少了。在Python中，如果想想把代码写的简洁优美，就应该在保证可读性的前提下代码行数越少越好。

三、常见的文件操作函数

Python的文件对象有多重类型的函数，如刷新缓存的flush函数，获取文件位置的tell函数，改变文件读取偏移量的seek函数。但是，工作中使用最多的还是与读写相关的函数。下面来看几个Python中的读写函数。

Python提供了三个读相关的函数，分别是read、readline和readlines，他们的作用如下：

read：读取文件中的所有内容；
readline：一次读取一行；
readlines：将文件内容存到一个列表中，列表中的每一行对应于文件中的每一行。

我们可以使用上边的”data.txt”文件，分别测试这三个读函数的效果：

In [1]: f = open(‘data.txt’)
In [2]: f.read()
Out[2]: ‘Beautiful is better than ugly.\nExplicit is better than implicit.\nSimple is better than complex.\nComplex is better than complicated.\n’
In [3]: f.seek(0)

Out[3]: 0

In [4]: f.readline()

Out[4]: ‘Beautiful is better than ugly.\n’

In [5]: f.seek(0)

Out[5]: 0

In [6]: f.readlines()

Out[6]:

[‘Beautiful is better than ugly.\n’,

‘Explicit is better than implicit.\n’,

‘Simple is better than complex.\n’,

‘Complex is better than complicated.\n’]

这里可以看到，read和readlines函数都是一次就将所有内容读入内存中，对于文件较小的情况不会有什么问题。但是，如果处理的是大文件，这种使用方法会占用大量的内存，甚至有可能因为内存占用太多出现Out-Of-Memory错误。

Python提供了两个写函数，分别是write和writelines，他们的区别如下：

write：写字符串到文件中，并返回写入的字符串；
writelines：写一个字符串列表到文件中。

依然使用Ipython对文件对象的写入函数进行测试，并在写入完成以后使用Linux的cat命令查看文件内容：

In [1]: f = open(‘data.txt’,’w’)
In [2]: f.write(‘Beautiful is better than ugly.’)
Out[2]: 30
In [3]: f.writelines([‘Explicit is better than implicit.’,’Simple is better than complex.’])

cat data.txt

在Python中，除了使用文件对象的write函数和writelines函数向文件写入数据以外，也可以使用print函数将输出结果输出到文件中。print函数比write和writelines函数更加灵活，如下所示：

From __fureture__ import print_function
With open(‘data.txt’,’w’)as f:
print(1,2,’hello world’,sep”,”.file=f)

posted @ 2020-08-11 14:12 星火撩原阅读(1250) 评论(0) 收藏举报

刷新页面返回顶部

刘军军

Python Linux系统管理之文件读写

公告