第八课时之输入与输出
7.输入与输出
一个程序可以有几种输出方式:以人类可读的方式打印数据,或者写入一个文件供以后使用
7.1格式化输出
我们有两种大相径庭地输出值方法:表达式语句和print()函数(第三种访求是使用文件对象的write()方法,标准文件输出可以参考sys.stdout,详细内容参见库参考手册)
通常弄你想要对输出做更多的格式控制,而不是简单的打印使用空格分隔的值。有两种方法可以格式化你的输出:第一种方法是由你自己处理整个字符串,通过使用字符串切割和连接操作可以创建任何你想要的输出形式。string类型包含一些将字符串填充到指定列宽度的有用操作,随后就会讨论这些。第二种方法是使用str.format()方法。
标准模块string包括了一些操作,将字符串填充入给定列时,这些操作很有用。随后我们会讨论这部分内容。第二种方法是使用Template方法。
当然,还有一个问题,如何将值转化为字符串?很幸运,python有方法将任意值转为字符串:将它传入repr()或str()函数
函数str()用于将值转化为适于人阅读的形式,而repr()转化为供解释器读取的形式(如果没有等价的语法,则会发生SyntaxError异常)某对象没有适于人阅读的解释形式的话,str()会返回与repr()等同的值。很多类型,诸如数值或链表,字典这样的结构,针对各函数都有着统一的解读方式。字符串和浮点数,有着独特的解读方式
有两种方式可以写平方和立方表:
注意:第一个例子,print()在每列之间加了一个空格,它总是在参数间加入空格
以上是一个str.rjust()方法的演示,他把字符串输出到一列,并通过向左侧填充空格来使其右对齐。类似的方法还有str.ljust()和str.center()。这些函数只是输出新的字符串,并不改变什么。如果输出的字符串太长,它们也不会截取它,而是原样输出,这会使你的输出格式变得混乱,不过总强过另一种选择(截取字符串),因为那样会产生错误的输出值(如果你确实需要截取它,可以使用切割操作,例如:x.ljust(n)[:n]).
还有另一个方法,str.zfill()它用于向数值的字符串表达左侧填充0。该函数可以正确理解正负号:
方法str.format()的基本用法如下:
大括号和其中的字符会被替换成传入str.format()的参数。大括号中的数值指明使用传入str.format()方法的对象中的哪一个:
如果在str.format()调用时使用关键字参数,可以通过参数名来引用值:
位置参数和关键字参数可以随意组合,但传参必须位置参数在前:
字段名后允许可选的’:’和格式指令。这允许对值的格式化加以更深入的控制。下例将pi转为三位精度。
在字段后的’:’后面加一个整数会限定该字段的最小的宽度,这在美化表格时很有用:
如果你有个实在是很长的格式化字符串,不想分割它。如果你可以用命名来引用被格式化的变量而不是位置就好了。有个简单的方法,可以传入一个字典,用中括号(‘[]’)访问它的键:
也可以使用(**)标志将这个字典以关键字参数的方式传入:
这种方式与心得内置函数vars()组合使用非常有效。该函数返回包含所有局部变量的字典。要进一步了解字符串格式化的方法str.format()参见格式字符串方法。
7.1.1旧式的字符串格式化
操作符%也可以用于字符串格式化。它以类似sprintf()-style的方式解析左参数,将右参数应用于此,得到格式化操作生成的字符串,例如:
更多的信息可以参见printf-style String Formatting一节
7.2文件读写
函数open()返回文件对象,通常的用法需要两个参数:open(filename,mode)
第一个参数是一个含有文件名的字符串。第二个参数也是一个字符串,含有描述如何使用该文件的几个字符。mode为’r’时表示只是读取文件;’w’表示只是写入文件(已经存在的同名文件将被删掉);’a’表示打开文件进行追加,写入到文件中的任何数据将自动添加到末尾。’r+’表示打开文件进行读取和写入。mode参数是可选的,默认为’r’。
通常文件以文本打开,这意味着你从文件读出和向文件写入的字符串会被特定的编码方式(默认是utf-8)编码。模式后面的’b’以二进制模式打开文件;数据会以字节对象的形式读出和写入。这种模式应该用于所有不包含文本的文件。
在文本模式下,读取时摩尔你会将平台有关的行结束符(Unix上是\n.Windows上是\r\n)转换为\n,在文本模式下写入时,默认会将出现的\n转换成平台有关的行结束符。这种暗地里的修改对ASCII文本文件没有问题,但会是损坏JPEG或EXE这样的二进制文件中的数据。使用二进制模式读写此类文件时要特别小心。
7.2.1文件对象方法
本节中的示例都默认文件对象f已经创建
要读取文件内容,需要调用f.read(size),该方法读取若干数量的数据并以字符串形式返回其内容,size是可选的数值,指定字符串长度。如果没有指定size或者指定为负数,就会读取并返回整个文件。当文件大小为当前机器内存的两倍时,就会产生问题。反之会尽可能按比较大的size读取和返回数据。如果到了文件末尾,f.read()会返回一个空字符串(‘ ’):
-f.readline()从文件中读取单独一行,字符串结尾会自动加上一个换行符(\n),只有当文件最后一行没有以换行符结尾时,这个操作才会被忽略。这样返回值就不会有混淆,如果f.readline()返回一个空字符串,那就表示到达了文件结尾,如果是一个空行,就会描述为’\n’,一个只包含换行符的字符串:
你可以循环遍历文件对象来读取文件中的每一行。这是一种高效,快速,并且代码简介的方式:
如果你想把文件中的所有行读到一个列表中,你也可以使用list(f)或者f.readlines()。
-f.write(string)方法将string的内容写入文件,并返回写入字符的长度:
想要写入其他非字符串内容,首先要将它转换为字符串:
f.tell()返回一个整数,代表文件对象在文件中的指针位置,该数值计量了自文件开头到指针处的比特数。需要改变文件对象指针话话,使用f.seek(offset,from_what)。指针在该操作中从指定的引用位置移动offset比特,引用位置由from_what参数指定。
from_what值为0表示自文件起始处开始,1表示自当前文件指针位置开始,2表示自文件末尾开始。from_what可以忽略。其默认值为零,此时从文件头开始:
在文本文件中(没有以b模式打开),只允许从文件头开始寻找(有个例外是用seek(0,2)寻找文件的最末尾处)而且合法的偏移值只能是f.tell()返回的值或者是零。其他任何偏移值都会产生未定义的行为。
当你使用完一个文件时,调用f.close()方法就可以关闭它病释放其占用的所有系统资源。在调用f.close()方法后,试图再次使用文件对象将会自动失败。
用关键字with处理文件对象是个好习惯。它的先进之处在于文件用完后会自动关闭,就算发生异常也没关系。它是try-finally块的简写:
文件对象还有一些不太常用的附加方法,比如isatty()和truncate()在库参考手册中有文件对象的完整指南。
7.2.2使用json存储结构化数据
用户不是非得自己编写和调试保存复杂数据类型的代码,python允许你使用常用的数据交换格式JSON(JavaScript Object Notation)。标准模块json可以接受python数据结构,并将它们转换为字符串表示形式:此过程称为序列化。从字符串表示形式重新构建数据结构称为反序列化。序列化和反序列化的过程中,表示该对象的字符串可以存储在文件或数据中,也可以通过网络连接传送给远程的机器。
如果你有一个对象A,你可以用简单的一行代码查看JSON字符串表示形式:
dumps()函数的另外一个变体dump(),直接将对象序列化到一个文件。所以如果f是为写入而打开的一个文件对象,我们可以这样做:
为了重新解码对象,如果f是为读取而打开的文件对象:
X=json.load(f)
这种简单的序列化技术可以处理列表和字典,但序列化任意类实例为JSON需要一点额外的努力。Json模块的手册对此有详细的解释。
补充:
pickle--pickle模块
与JSON不同,pickle是一个协议,它允许任意复杂的python对象的序列化。因此他只能用于python而不能用来与其他语言编写的程序进行通信。默认情况下他也是不安全的:如果数据有熟练的攻击者精心设计,反序列化来自一个不受信任源的pickle数据可以执行任意代码。