python基础之错误、调试(异常处理)
在程序运行过程中,总会遇到各种各样的错误。
有的错误是程序编写有问题造成的,比如本来应该输出整数结果输出了字符串,这种错误我们通常称之为bug,bug是必须修复的。
有的错误是用户输入造成的,比如让用户输入email地址,结果得到一个空字符串,这种错误可以通过检查用户输入来做相应的处理。
还有一类错误是完全无法在程序运行过程中预测的,比如写入文件的时候,磁盘满了,写不进去了,或者从网络抓取数据,网络突然断掉了。这类错误也称为异常,在程序中通常是必须处理的,否则,程序会因为各种问题终止并退出。
Python内置了一套异常处理机制,来帮助我们进行错误处理。
此外,我们也需要跟踪程序的执行,查看变量的值是否正确,这个过程称为调试。Python的pdb可以让我们以单步方式执行代码。
最后,编写测试也很重要。有了良好的测试,就可以在程序修改后反复运行,确保程序输出符合我们编写的测试。
一、错误处理
1、语法错误
python的语法错误或者称之为解析错:SyntaxError: invalid syntax
2、异常
python程序的语法是正确的,但在运行期间检测到的错误称为异常,大多数的异常都不会被程序处理,都以错误信息的形式展现出来;常见的类型有: ZeroDivisionError,NameError 和 TypeError。
1 异常处理: 2 AttributeError 试图访问一个对象没有的树形,比如foo.x,但是foo没有属性x 3 IOError 输入/输出异常;基本上是无法打开文件 4 ImportError 无法引入模块或包;基本上是路径问题或名称错误 5 IndentationError 语法错误(的子类) ;代码没有正确对齐 6 IndexError 下标索引超出序列边界,比如当x只有三个元素,却试图访问x[5] 7 KeyError 试图访问字典里不存在的键 8 KeyboardInterrupt Ctrl+C被按下 9 NameError 使用一个还未被赋予对象的变量 10 SyntaxError Python代码非法,代码不能编译(个人认为这是语法错误,写错了) 11 TypeError 传入对象类型与要求的不符合 12 UnboundLocalError 试图访问一个还未被设置的局部变量,基本上是由于另有一个同名的全局变量, 13 导致你以为正在访问它 14 ValueError 传入一个调用者不期望的值,即使值的类型是正确的
3、异常处理
高级语言通常都内置了一套try...except...finally...的错误处理机制,python也不例外。
异常处理的三种方式:
try: print(a) except: print('Error') #try...except... try: print(a) except TypeError as e: print(e) except NameError as e: print(e) #try...except NAME_ERROR as E try: print(a) except NameError as e: print(e) except: print('Error') finally: print('hello') #finally下的是,不管程序是否错误都执行的代码块
try: # 主代码块 pass except KeyError,e: # 异常时,执行该块 pass else: # 主代码块执行完,执行该块 pass finally: # 无论异常与否,最终执行该块 pass
try语句按照如下方式工作;
- 首先,执行try子句(在关键字try和关键字except之间的语句)
- 如果没有异常发生,忽略except子句,try子句执行后结束。
- 如果在执行try子句的过程中发生了异常,那么try子句余下的部分将被忽略。如果异常的类型和 except 之后的名称相符,那么对应的except子句将被执行。最后执行 try 语句之后的代码。
- 如果一个异常没有与任何的except匹配,那么这个异常将会传递给上层的try中。
一个 try 语句可能包含多个except子句,分别来处理不同的特定的异常。最多只有一个分支会被执行。
处理程序将只针对对应的try子句中的异常进行处理,而不是其他的 try 的处理程序中的异常。
一个except子句可以同时处理多个异常,这些异常将被放在一个括号里成为一个元组,例如:
except (RuntimeError, TypeError, NameError): pass
最后一个except子句可以忽略异常的名称,它将被当作通配符使用。
try except 语句还有一个可选的else子句,如果使用这个子句,那么必须放在所有的except子句之后。这个子句将在try子句没有发生任何异常的时候执行。
try: a = 1 print(a) except NameError as e: print(e) except: print('Error') else: print('hello') #else里的代码块是在try内的代码没有发生错误的时候才执行 finally: print('world') #finally里的代码块是不管try里的代码是否正确都执行
使用 else 子句比把所有的语句都放在 try 子句里面要好,这样可以避免一些意想不到的、而except又没有捕获的异常。
4、记录错误
如果不捕获错误,自然可以让Python解释器来打印出错误堆栈,但程序也被结束了。既然我们能捕获错误,就可以把错误堆栈打印出来,然后分析错误原因,同时,让程序继续执行下去。
Python内置的logging
模块可以非常容易地记录错误信息:
import logging def foo(s): return 10 / int(s) def bar(s): return foo(s) * 2 def main(): try: res = bar('0') print(res) except Exception as e: # print(e) logging.exception(e) #记录错误信息 main() print('END')
同样是出错,但程序打印完错误信息后会继续执行,并正常退出。
5、抛出错误
因为错误是class,捕获一个错误就是捕获到该class的一个实例。因此,错误并不是凭空产生的,而是有意创建并抛出的。Python的内置函数会抛出很多类型的错误,我们自己编写的函数也可以抛出错误。只有在必要的时候才定义我们自己的错误类型。
捕获错误的目的只是记录一下,便于后续追踪。可以通过raise语句来实现:
try: print(a) except NameError as e: print(e) raise
raise语句如果不带参数,就会把当前错误原样抛出。此外,在except中raise一个Error还可以把一种类型的错误转化成另一种类型,只要是合理的转换逻辑就可以。
二、调试
程序能一次写完并正常运行的概率很小,基本不超过1%。总会有各种各样的bug需要修正。有的bug很简单,看看错误信息就知道,有的bug很复杂,我们需要知道出错时,哪些变量的值是正确的,哪些变量的值是错误的,因此,需要一整套调试程序的手段来修复bug。
1、简单直接、粗暴有效的就是用print()把可能有问题的变量打印出来看看
def foo(s): n = int(s) print('>>n = %d' % n) return 10 / n def main(): foo('0') main()
用print()最大的坏处是将来还得删掉它,想想程序里到处都是print(),运行结果中会包含很多垃圾信息。
2、断言
凡是用print()来辅助查看的地方,都可以用断言(assert)来替代:
def foo(s): n = int(s) assert n != 0,'s is zero' return 10 / n def main(): foo('0') main()
assert的意思是,表达式 n != 0应该是True,否则,根据程序运行的逻辑,后面的代码肯定会出错;如果断言失败,assert语句本身就会抛出AssertionError
启动python解释器时可以用-O参数来关闭assert,注意,“-O”时英文字母大写的O;关闭后,我们可以把所有的assert语句当成pass来看。
3、logging
把print()替换为logging是第三种方式,和assert比,logging不会抛出错误,而且可以输出到文件:
import logging s = '0' n = int(s) logging.info('n = %d' %n) print(10 / n)
logging允许你指定记录信息的级别,有debug,info,warning,error等几个级别,当我们指定level=INFO时,logging.debug就不起作用了。同理,指定level=WARNING后,debug和info就不起作用了。这样一来,我们就可以放心地输出不同级别的信息,也不用删除,最后统一控制输出哪个级别的信息。
logging的另一个好处是通过简单的配置,一条语句可以同时输出到不同的地方,比如console和文件。
4、pdb
启动python的调试器pdb,让程序以单步方式运行,可以随时查看运行状态。(-m pdb)
输入命令1来查看代码
输入命令n可以单步执行代码
输入命令p+变量名来查看变量
输入命令q结束调试,退出程序
5、pdb.set_trace()
这个方法也是用pdb,但是不需要单步执行,我们只需要import pdb,然后,在可能出错的地方放一个pdb.set_trace(),就可以设置一个断点
import pdb s = '0' n = int(s) pdb.set_trace() #程序运行到这里会暂停进入调试模式 print(10 / n)
运行代码,程序会自动在pdb.set_trace()暂停并进入pdb调试环境,可以用命令p查看变量,或者用命令c继续运行
6、IDE [集成开发环境(integrated development environment)]
如果要比较爽地设置断点、单步执行,就需要一个支持调试功能的IDE。目前比较好的Python IDE有:
Visual Studio Code:https://code.visualstudio.com/,需要安装Python插件。
PyCharm:http://www.jetbrains.com/pycharm/
另外,Eclipse加上pydev插件也可以调试Python程序。