python中的IO操作

python中的基本IO操作：

1) 键盘输入函数：raw_input(string)，不作处理的显示，与返回。

　　　　　　　　 input(string)，可以接受一个python表达式作为返回，python内部得到计算结果

2) 文件句柄(file)对象： file对象的创建必须通过open()函数来得到，

　　　　file object = open(file_name, access_mode, buffering)

　　file_name，需要指向的文件的路径，

　　access_mode，r，w，a (加号，表示读写权限都有，b表示按二进制格式写入)

　　　　　　　　　　写操作，可以创建文件，但是读操作和追加操作必须是有原文件的基础上的。

　　buffering，如果为0，表示系统不会缓存文件内容，为1，表示系统会缓存内容，具体的值，表示缓存具体的大小。

　　(rb,与wb的主要区别在，对于换行符的处理，按文本读入的时候，\r\n被自动替换为\n，文本写入的时候，\n被自动替换为\r\n；

　　　　仅仅改变byte流读写的处理，不涉及到程序内部的encode方式；

　　　　很多pkg内部写出的时候，会判读当前os的类型，软件自己处理换行，所以write一般选择wb；

　　　　read操作一般r与rb的结果相同，除非该文件是跨平台的)。

3) stringio，python在内存中开辟一块文本模式的buffer，可以像文件对象一样操作它。

　　StringIO(initial_value = '', newline= '\n')，操作与fp类似。 from io import StringIO

　　当调用fp.close的时候，释放当前buffer。

4) byteio，python在内存中开辟一款bytes类型(二进制格式)的buffer，可以像文件一样操作它。

　　ByteIO(initial_value = '', newline='\n')，操作与fp类似。 from io import BytesIO

　　当调用fp.close的时候，释放当前buffer。

　　stringio与byteio类似与C中的malloc，开辟临时buffer的；

　　而不是直接在file之间做数据缓存，file是保存在磁盘，速度较慢。

5) 类文件对象，file-like obj

　　socket对象，stdin，stdout等都是类文件对象。

数据交换输出格式：

文本文件多用在人机交互的数据交换，一般有doc格式，csv格式；

对于编程语言回见的数据交换，由于都必须使用同一的格式，所以多是xml，或者json格式类型的文件；

python内部obj变量的打包：

　　1：pickle包，可以对python内置的obj类型，或者自定义的obj进行序列化。

　　　　　　数据可以保存在file，stringio等各种buffer中。

　　　　　　dump(序列化到文件)

　　　　　　load(返回从文件反序列化的对象)

　　　　　　pickle.dump(d，f). d = pickle.load(fp)

　　2： json包，对python中的各种obj，保存在类文件中，并且按json的格式.

　　　　　　dump，load函数。

　　序列化到文件，一般都按二进制格式进行文件的open与close。

file object的属性和方法：

属性： 1) closed，表示文件是否已经被关闭；

　　　　2) mode，表示文件是以何种方式被打开的；

　　　　3) name，表示文件的路径名字；

方法： 1) close()，关闭文件句柄，同时刷新缓冲区内的信息到文件；

　　　　2) write()，将任何字符串，写入文件，行尾的换行符和原封不动；

　　　　　　writeline(str)，将字符串写入文件，

　　　　　　writelines(seq)，参数是列表，自动迭代写入文件，

　　　　3) read(count)，读出某个大小的字符串，不指定，读取全部；

　　　　　　readlines()，读取所有行，将他们作为一个字符串列表返回，包含\n；

　　　　　　readline()，读取打开文件的一行，包括行结束符，作为字符串返回。

　　　　4) flush()，从内存中，刷新文件；

　　　　5) next()，返回文件中的下一行；

　　　　6) tell()，返回当前文件对象的位置(不以行为单位)；

　　　　7) seek(offset, where)，设置文件对象的位置；0表示文件开始，1表示当前位置，2表示文件结尾；

文件的open与close必须是对称的，如果文件读写过程中，出现问题，之后的close就执行不到，所以为了解决这个问题，

　　多使用try,,,finally，来操作文件；

　　　　try：

　　　　　　f = open('./../../1.txt', 'r')

　　　　　　print (f.read())

　　　　　　....

　　　　finally：

　　　　　　if f：

　　　　　　　　f.close()

这样来保证file的close，但是这样的书写太过繁琐，所以python引入了with的用法：

　　with open('./../1.txt', 'r') as f：

　　　　print (f.read())

这样在with这个复合语句中，调用file object，之后会被自动close，

如果要访问每一行的内容，可以有两种写法：

　　1) for line in f.readlines()： #readlines()返回的是一个list

　　　　　......

　　2) for line in f： #file object有next函数，是iterable的

　　　　　....

文件的编码格式有字节编码，与二进制编码。

　　二进制编码多用在编程语言之间进行数据交流；字节编码多用在人机交互。

　　二进制编码多用在机器程序，图片(bmp)，视频文件(mkv)的描述，二进制编码本身比较节约资源。

　　　　不能直接可见，需要特殊的解释器来进行翻译。

　　　　基于值编码，不同的文件格式之间，完全没有关系。

　　字节文件，从最初的ASCII编码，到utf8/16/32(文件头的bom格式来标记文件是哪一种utf编码)，将nbit的数字与特定的字符一一绑定。

　　　　基于byte的定长编码，来方便解析。直接可见。

posted @ 2018-01-08 19:38 _9_8 阅读(851) 评论(0) 收藏举报

刷新页面返回顶部

_9_8

python中的IO操作

公告