python学习[第十四篇] 文件的输入与输出
python学习[第十四篇] 文件的输入与输出
标准文件类型
一般来说只要程序一执行,就会访问3个文件:
标准输入(键盘) stdin
标准输出(显示器缓冲区) stdout 默认输出到屏幕
标准错误(到屏幕的非缓冲输出) stderr 默认输出到屏幕
可以通过sys模块来访问这些文件的句柄,sys.stdin,sys.stdout,sys.stderr 可以通过print >>重定向到标准输出文件中
>>> import sys >>> print >> sys.stderr, 'jhh' jhh >>> print >> sys.stdout, 'jhh' jhh
文件对象
文件对象不仅可以用来访问普通的磁盘文件,也可以访问如上的抽象层面的文件。
可以通过内建函数file() 和open()作为钩子来操作文件。file()和open()具有相同功能,一般open作为读文件用,file文件用来写和其他操作。
文件对象的访问模式:
r | 以读方式打开 |
rU | 以读方式打开,同时支持通用换行符 |
r+ | 以读写模式打开 |
rb | 以二进制读模式打开 |
rb+ | 以二进制读写模式打开 |
w | 以写模式打开 |
w+ | 以读写模式开店 |
wb | 以二进制写模式打开 |
wb+ | 以二进制读写模式打开 |
a | 以追加方式打开 |
a+ | 以读写模式打开 |
ab | 以二进制追加模式打开 |
ab+ | 以二进制读写模式打开 |
文件内建方法
文件方法可以分为四类 ,输入,输出,文件内移动和杂项
输入
read(size=-1)直接读取字节到字符串中,最多读取给定字节数,如果size没有指定,则size默认值为-1直接读取到文件末尾。
readline(size=-1) 读取文件的一行,然后整行包括换行符作为字符串返回。如果指定size且读取size个字节后没有达到末尾,那么就返回size个字节到字符串
realines(sizhint) 会读取剩余的行数,然后以字符串列表的形式返回。如果sizhint大于0 ,那么会返回大约sizehint个字符串,因为有字符串缓冲区的关系。
xreadlines() 会返回一个迭代类型。
>>> f=file('d:/test.txt','r') >>> f.read(3) 'thi' >>> f.readline(3) 's i' >>> f.readline() 's a test12345\n' >>> f.readlines() ['67890\n'] >>> f.tell() 28L>>> f.seek(0) >>> for x in f.xreadlines(): ... print x, ... this is a test12345
输出
write()把文本数据或二进制数据写到文件中。
writelines() 接收一个列表作为参数,换行符不会被自动加入,如果需要加入换行符的话需要手动加入。
>>> f=file('d:/test.txt','w') >>> ttt='this is a test' >>> f.write(ttt) >>> f.tell() 14L >>> flines=['12345\n','67890\n'] >>> f.writelines(flines) >>> f.close()
文件内移动
seek(offset)方法 可以在文件中移动指针到不同的位置。offsite字节代表相对于某个位置的偏移量。offset默认为0
tell() 是seek的补充,告诉当前文件指针在文件的位置。
文件迭代
文件迭代方法比旧方法(逐一行读取),更为高效,而且写法简洁。
for eachline in f:
suite_to_repeat
旧方法 逐一行读取
for eachline in f.readline():
suite_to_repeat
#文件迭代 >>> f.seek(0) >>> for x in f: ... print x, ... this is a test12345 67890 #旧方法,一次读入文件,然后遍历文件每一行 >>> f.seek(0) >>> for x in f.readlines(): ... print x, ... this is a test12345 67890 #旧方法,每次都一行文件直到文件末尾 >>> while True: ... x = f.readline() ... if x: ... print x, ... else: ... break ... this is a test12345 67890
其他方法
close() 是file和open之后 用来关闭句柄的方法。要养成良好的编程习惯,打开文件句柄后,一定要记得关闭句柄
fileno()返回打开文件的描述符,是一个整型
flush()会将缓冲区数据立刻写入磁盘。
truncate(size) 如果给定size那么文件将被截取到size字节处。,如果没有给定size,那么将截取到当前位置,如果为0
文件对象内建属性
file.closed() 文件是否被关闭,未关闭则为false
file.encoding 文件使用的编码。 encoding为non 则使用系统默认编码
file.mode 文件的打开模式
file.name文件名
file.newlines 未读取到行分割符时为None,只有一种分隔符时为一个字符串,如果有多种分隔符时,则包含当前所遇到的所有分隔符的列表
file.softspace 为0表示在输出一个数据后加上空格符,为1表示不加
>>> print f.name d:/test.txt >>> print f.fileno <built-in method fileno of file object at 0x01F6D1D8> >>> print f.closed False >>> print f.encoding None >>> print f.mode r >>> print f.newlines None >>> print f.softspace 0
命令行参数
sys模块通过调用sys.argv属性提供了对命令行参数的访问。
sys.argv是命令行参数的列表 len(sys.arge)是命令行参数的个数,即c语言中的argc.
sys.argv[0]永远是程序的名称。
获取命令行参数在编写脚本时非常有用。例如
copy_file_to_each_server.py serverlist
此时sys.argv[0]即为文件名: copy_file_to_each_server.py ,而sys.argv[1]即为我们需要的参数 server列表我们通过遍历server列表将文件copy到每个server上。
命令行参数 :其他有用模块 getopt,getparse.
### cmdargs.py import sys allargs=sys.argv print 'program name is : ',sys.argv[0] print 'parameters are :' ,sys.argv[1:] # results is C:\Users\Ryan\Desktop>python cmdargs.py 1 2 3 4 program name is : cmdargs.py parameters are : ['1', '2', '3', '4']
#####end