python文件处理之fileinput
一、介绍
fileinput模块可以对一个或多个文件中的内容进行迭代、遍历等操作,我们常用的open函数是对一个文件进行读写操作。
fileinput模块的input()函数比open函数更高效和好用,体现在:
- input()函数生成一个迭代器,保证了在遇到大文件的读取时不会占用太大的内存。
- 用fileinput对文件进行循环遍历,格式化输出,查找、替换等操作,还能获取每一行的行号等等,非常方便。
二、fileinput读取文件函数input的使用格式
fileinput.input (files='filename', inplace=False, backup='', bufsize=0, mode='r', openhook=None)
files: # 文件的路径列表,默认是stdin方式,多文件['1.txt','2.txt',...] inplace: # 是否将标准输出的结果写回文件,默认不取代 backup: # 备份文件的扩展名,只指定扩展名,如.bak。如果该文件的备份文件已存在,则会自动覆盖。 bufsize: # 缓冲区大小,默认为0,如果文件很大,可以修改此参数,一般默认即可 mode: # 读写模式,默认为只读 openhook: # 该钩子用于控制打开的所有文件,比如说编码方式等;
三、fileinput中的常用函数
函数 | 描述 |
input([files[, inplace[, backup]]]) | 帮助迭代多个输入流中的行 |
filename() | 返回当前文件的名称 |
lineno() | 返回(累计的)当前行号 |
filelineno() | 返回在当前文件中的行号 |
isfirstline() | 检查当前行是否是文件中的第一行 |
isstdin() | 检查最后一行是否来自sys.stdin |
nextfile() | 关闭当前文件并移到下一个文件 |
close() | 关闭序列 |
fileinput.input是最重要的函数,它返回一个迭代器对象,如果要处理多个文件,可以向这个函数提供一个或多个文件名。
还可将参数inplace设置为True(inplace=True),对于你访问的每一行,都需打印出替代内容,这些内容将被写回到当前输入文件中,此时可选参数backup用于给从原始文件创建的备份文件指定扩展名。
四、示例
1、读取多个文件
# a.txt文件的内容 """ 我 是 好 人 """ # b.txt文件的内容 """ 他 是 坏 人 """ # 读取一个文件 for line in fileinput.input("a.txt"): print(line) # 读取多个文件 for line in fileinput.input(["a.txt", "b.txt"]): print(line)
2、修改文件并备份原文件
# -*_ coding:utf-8 -*- import fileinput for line in fileinput.input("a.txt", backup=".bak", inplace=True): line = line.replace("我", "小明") print(line) # 结果 当前文件夹会生成a.txt.bak文件,内容是之前的内容, 而a.txt文件已经被修改了,把"我"变成了"小明"
3、输出当前行号和行内容
# -*_ coding:utf-8 -*- import fileinput for line in fileinput.input("a.txt"): lineno = fileinput.filelineno() print lineno, line # 结果 1 我 2 是 3 好、 4 人
4、输出文件名
# -*_ coding:utf-8 -*- import fileinput for line in fileinput.input("a.txt"): # 在第一行前面先输出文件名 if fileinput.isfirstline(): print fileinput.filename() print line # 结果 a.txt 我 是 好、 人
其他函数,都是类似的使用方法,这里就不全部介绍了。