Python pdb模块的使用

野路子出生，写Python也有段时间了，一般的调试都用的print, PyCharm的debug功能也用的比较少，主要一般也用不到，第二是自己也不怎么会用.

服务器开发，本地根本没有运行的环境，前面学习了unittest，现在一般都会写单元测试，单总有一些情况会发生在意外之中, 更多的时候，我只能使用print大法，输出自己想看的数据或者变量信息，但这确实又慢又臭，很多时候，项目测试运行很慢，好不容易到了测试点，输出的信息可能不够全面，然后又要重新print需要的信息，并再次启动项目，这可真是劳民伤财。

最近单位比较空一点，看了新版的《Effective Python》一书，书中有介绍pdb的使用，以前虽然也知道这个模块，但基于水平有限以及懒等多方面原因，一直没有接触，这次书中的简单介绍以及官网的查看，发现，这个真是一个好东西，服务器调试的神器。

如果还是很懒不想看pdb，上次跟一个群友交流，他说一般用print(locals())，在需要的地方输出，一试还真是一个好东西，一直知道locals函数，看来用在测试的地方真不错

参考:《Effective Python》书P322页

官网链接:https://docs.python.org/zh-cn/3/library/pdb.html

import math

def compute_rmse(observed, ideal):
    total_err_2 = 0
    count = 0
    for got, wanted in zip(observed, ideal):
        err_2 = (got - wanted) ** 2
        breakpoint()  # Start the debugger here
        # 与上面的breakpoint效果一致
        # import pdb
        # pdb.set_trace()
        total_err_2 += err_2
        count += 1

    mean_err = total_err_2 / count
    rmse = math.sqrt(mean_err)
    return rmse

result = compute_rmse(
    [1.8, 1.7, 3.2, 6],
    [2, 1.5, 3, 5])
print(result)

Python3.7 新版功能: 内置函数 breakpoint()，当以默认参数调用它时，可以用来代替 import pdb; pdb.set_trace()。

上面的文字已经说明了示例代码中的情况, 通过在需要断点的地方进行breakpoint()的插入，就会在该处断点，并弹出pdb的交易界面。

很多时候，我们并不知道具体那里会出问题，或者出问题的地方比较随机，手动设置breakpoint不合适.

例如:

python3 -m pdb myscript.py

当作为脚本调用时，如果要调试的程序异常退出，pdb 调试将自动进入事后调试。事后调试之后（或程序正常退出之后），pdb 将重新启动程序。自动重启会保留 pdb 的状态（如断点），在大多数情况下，这比在退出程序的同时退出调试器更加实用。

书中的介绍还有一种方式为

python3 -m pdb -c continue myscript.py的方式运行

其实都一样，第二种就是第一种运行之后，直接接入continue命令的情况.

上面摘录的那段话，我的实际使用为感觉情况为:

当 python3 -m pdb myscript.py的执行，马上进行调试界面，

敲入continue命令后，会去寻找运行的项目中的breakpoint或者遇到错误时的，自动生成一个断点，就好比在那个错误之前手动设置了一个breakponit, 你可以在那个pdb环境中调试自己需要的参数，当q退出的时候，它将返回并返回最初的pdb状态。

还有一种在交互的情况下，进入调试模块，我想一般情况下，我应该不会用，所以就不写了.

下面是摘抄至官网的相关命令的含义

h(elp) [command]: 不带参数时，显示可用的命令列表。参数为 command 时，打印有关该命令的帮助。help pdb 显示完整文档（即 pdb 模块的文档字符串）。由于 command 参数必须是标识符，因此要获取 ! 的帮助必须输入 help exec。

w(here): 打印堆栈回溯，最新一帧在底部。有一个箭头指向当前帧，该帧决定了大多数命令的上下文。

d(own) [count]: 在堆栈回溯中，将当前帧向下移动 count 级（默认为 1 级，移向更新的帧）。

u(p) [count]: 在堆栈回溯中，将当前帧向上移动 count 级（默认为 1 级，移向更老的帧）。

b(reak) [([filename:]lineno | function) [, condition]]

如果带有 lineno 参数，则在当前文件相应行处设置一个断点。如果带有 function 参数，则在该函数的第一条可执行语句处设置一个断点。行号可以加上文件名和冒号作为前缀，以在另一个文件（可能是尚未加载的文件）中设置一个断点。另一个文件将在 sys.path 范围内搜索。请注意，每个断点都分配有一个编号，其他所有断点命令都引用该编号。

如果第二个参数存在，它应该是一个表达式，且它的计算值为 true 时断点才起作用。

如果不带参数执行，将列出所有中断，包括每个断点、命中该断点的次数、当前的忽略次数以及关联的条件（如果有）。

tbreak [([filename:]lineno | function) [, condition]]: 临时断点，在第一次命中时会自动删除。它的参数与 break 相同。

cl(ear) [filename:lineno | bpnumber ...]: 如果参数是 filename:lineno，则清除此行上的所有断点。如果参数是空格分隔的断点编号列表，则清除这些断点。如果不带参数，则清除所有断点（但会先提示确认）。

disable [bpnumber ...]: 禁用断点，断点以空格分隔的断点编号列表给出。禁用断点表示它不会导致程序停止执行，但是与清除断点不同，禁用的断点将保留在断点列表中并且可以（重新）启用。

enable [bpnumber ...]: 启用指定的断点。

ignore bpnumber [count]: 为指定的断点编号设置忽略次数。如果省略 count，则忽略次数将设置为 0。忽略次数为 0 时断点将变为活动状态。如果为非零值，在每次达到断点，且断点未禁用，且关联条件计算值为 true 的情况下，该忽略次数会递减。

condition bpnumber [condition]: 为断点设置一个新 condition，它是一个表达式，且它的计算值为 true 时断点才起作用。如果没有给出 condition，则删除现有条件，也就是将断点设为无条件。

commands [bpnumber]

为编号是 bpnumber 的断点指定一系列命令。命令内容将显示在后续的几行中。输入仅包含 end 的行来结束命令列表。举个例子:

(Pdb) commands 1
(com) p some_variable
(com) end
(Pdb)

要删除断点上的所有命令，请输入 commands 并立即以 end 结尾，也就是不指定任何命令。

如果不带 bpnumber 参数，commands 作用于最后一个被设置的断点。

可以为断点指定命令来重新启动程序。只需使用 continue 或 step 命令或其他可以继续运行程序的命令。

如果指定了某个继续运行程序的命令（目前包括 continue, step, next, return, jump, quit 及它们的缩写）将终止命令列表（就像该命令后紧跟着 end）。因为在任何时候继续运行下去（即使是简单的 next 或 step），都可能会遇到另一个断点，该断点可能具有自己的命令列表，这导致要执行的列表含糊不清。

如果在命令列表中加入 'silent' 命令，那么在该断点处停下时就不会打印常规信息。如果希望断点打印特定信息后继续运行，这可能是理想的。如果没有其他命令来打印一些信息，则看不到已达到断点的迹象。

s(tep): 运行当前行，在第一个可以停止的位置（在被调用的函数内部或在当前函数的下一行）停下。

n(ext): 继续运行，直到运行到当前函数的下一行，或当前函数返回为止。（ next 和 step 之间的区别在于，step 进入被调用函数内部并停止，而 next （几乎）全速运行被调用函数，仅在当前函数的下一行停止。）

unt(il) [lineno]

如果不带参数，则继续运行，直到行号比当前行大时停止。

如果带有行号，则继续运行，直到行号大于或等于该行号时停止。在这两种情况下，当前帧返回时也将停止。

在 3.2 版更改: 允许明确给定行号。

r(eturn): 继续运行，直到当前函数返回。

c(ont(inue)): 继续运行，仅在遇到断点时停止。

j(ump) lineno

设置即将运行的下一行。仅可用于堆栈最底部的帧。它可以往回跳来再次运行代码，也可以往前跳来跳过不想运行的代码。

需要注意的是，不是所有的跳转都是允许的 -- 例如，不能跳转到 for 循环的中间或跳出 finally 子句。

l(ist) [first[, last]]

列出当前文件的源代码。如果不带参数，则列出当前行周围的 11 行，或继续前一个列表。如果用 . 作为参数，则列出当前行周围的 11 行。如果带有一个参数，则列出那一行周围的 11 行。如果带有两个参数，则列出所给的范围中的代码；如果第二个参数小于第一个参数，则将其解释为列出行数的计数。

当前帧中的当前行用 -> 标记。如果正在调试异常，且最早抛出或传递该异常的行不是当前行，则那一行用 >> 标记。

3.2 新版功能: >> 标记。

ll | longlist: 列出当前函数或帧的所有源代码。相关行的标记与 list 相同。

3.2 新版功能.

a(rgs): 打印当前函数的参数列表。

p expression: 在当前上下文中运行 expression 并打印它的值。

注解

print() 也可以使用，但它不是一个调试器命令 --- 它执行 Python print() 函数。

pp expression: 与 p 命令类似，但表达式的值使用 pprint 模块美观地打印。

whatis expression: 打印 expression 的类型。

source expression: 尝试获取给定对象的源代码并显示出来。

3.2 新版功能.

display [expression]

如果表达式的值发生改变则显示它的值，每次将停止执行当前帧。

不带表达式则列出当前帧的所有显示表达式。

3.2 新版功能.

undisplay [expression]: 不再显示当前帧中的表达式。不带表达式则清除当前帧的所有显示表达式。

3.2 新版功能.

interact: 启动一个交互式解释器（使用 code 模块），它的全局命名空间将包含当前作用域中的所有（全局和局部）名称。

3.2 新版功能.

alias [name [command]]

创建一个标识为 name 的别名来执行 command。执行的命令不可加上引号。可替换形参可通过 %1, %2 等来标示，而 %* 会被所有形参所替换。如果没有给出命令，则会显示 name 的当前别名。如果没有给出参数，则会列出所有别名。

别名允许嵌套并可包含能在 pdb 提示符下合法输入的任何内容。请注意内部 pdb 命令可以被别名所覆盖。这样的命令将被隐藏直到别名被移除。别名会递归地应用到命令行的第一个单词；行内的其他单词不会受影响。

作为示例，这里列出了两个有用的别名（特别适合放在 .pdbrc 文件中）:

# Print instance variables (usage "pi classInst")
alias pi for k in %1.__dict__.keys(): print("%1.",k,"=",%1.__dict__[k])
# Print instance variables in self
alias ps pi self

unalias name: 删除指定的别名。

! statement

在当前堆栈帧的上下文中执行 (单行) statement。感叹号可以被省略，除非语句的第一个单词与调试器命令重名。要设置全局变量，你可以在同一行上为赋值命令添加前缀的 global 语句，例如:

(Pdb) global list_options; list_options = ['-l']
(Pdb)

run [args ...]
restart [args ...]: 重启被调试的 Python 程序。如果提供了参数，它会用 shlex 来拆分且拆分结果将被用作新的 sys.argv。历史、中断点、动作和调试器选项将被保留。 restart 是 run 的一个别名。

q(uit): 退出调试器。被执行的程序将被中止。

debug code: 进入一个对代码参数执行步进的递归调试器（该参数是在当前环境中执行的任意表达式或语句）。

retval: 打印函数最后一次返回的返回值。

感觉官网的翻译，比书中的详细，以后在简历中必须写上会pdb调试，以及单元测试完善，要不然我自己作为过来人，感觉你肯定不是一个合格的Python开发

或者你写的项目是在太小了，一个模块就到底。

posted @ 2022-10-11 16:19 就是想学习阅读(455) 评论(0) 收藏举报

区块链散户一枚

Python中毒爱好者

Python pdb模块的使用

公告