GDB(The GNU Project Debugger)的基本使用方法

关键词：GDB。

GDB调试的三种方式：

1. 目标板直接使用GDB进行调试。

2. 目标板使用gdbserver，主机使用xxx-linux-gdb作为客户端。

3. 目标板使用ulimit -c unlimited，生成core文件；然后主机使用xxx-linux-gdb ./test ./core。

Brendan Gregg关于gdb介绍《gdb Debugging Full Example (Tutorial): ncurses》。

GDB官网：GDB: The GNU Project Debugger (sourceware.org)，GDB官方文档(Debugging with GDB)。

1. gdb调试

构造测试程序如下main.c和sum.c如下:

main.c:

#include <stdio.h>
#include <stdlib.h>
 
extern int sum(int value);
 
struct inout {
    int value;
    int result;
};

int main(int argc, char * argv[])
{
    struct inout * io = (struct inout * ) malloc(sizeof(struct inout));
    if (NULL == io) {
        printf("Malloc failed.\n");
        return -1;
    }

    if (argc != 2) {
        printf("Wrong para!\n");
        return -1;
    }

    io -> value = *argv[1] - '0';
    io -> result = sum(io -> value);
    printf("Your enter: %d, result:%d\n", io -> value, io -> result);
    return 0;
}

sum.c:

int sum(int value) {
    int result = 0;
    int i = 0;
    for (i = 0; i < value; i++)
        result += (i + 1);
    return result;
}

然后gcc main.c sum.c -o main -g, 得到main可执行文件.

下面介绍了gdb大部分功能，1.1 设置断点以及 1.3显示栈帧是常用功能；调试过程中可以需要1.6 单步执行，并且1.4 显示变量、1.5显示寄存器、1.8 监视点、1.9 改变变量的值。

如果进程已经运行中，需要1.11 attach到进程，或者1.10 生成转储文件进行分析。当然为了提高效率可以自定义1.13 初始化文件。

1.1 设置断点

设置断点可以通过b或者break设置断点，断点的设置可以通过函数名、行号、文件名+函数名、文件名+行号以及偏移量、地址等进行设置。

格式为：

break 函数名

break 行号

break 文件名:函数名

break 文件名:行号

break +偏移量

break -偏移量

break *地址

查看断点，通过info break查看断点列表。

删除断点通过命令包括：

delete <断点id>：删除指定断点

delete：删除所有断点

clear

clear 函数名

clear 行号

clear 文件名：行号

clear 文件名：函数名

断点还可以条件断住

break 断点 if 条件；比如break sum if value==9，当输入的value为9的时候才会断住。

condition 断点编号：给指定断点删除触发条件

condition 断点编号条件：给指定断点添加触发条件

如下可以看出，当入参为9的时候被断住，而入参为8的时候运行到结束。

断点还可以通过disable/enable临时停用启用。

disable

disable 断点编号

disable display 显示编号

disable mem 内存区域

enable

enable 断点编号

enable once 断点编号：该断点只启用一次，程序运行到该断点并暂停后，该断点即被禁用。

enable delete 断点编号

enable display 显示编号

enable mem 内存区域

1.1.1 断点commands高级功能

大多数时候需要在断点处执行一系列动作，gdb提供了在断点处执行命令的高级功能commands。

#include <stdio.h>

int total = 0;

int square(int i)
{
    int result=0;

    result = i*i;

    return result;
}

int main(int argc, char **argv)
{
    int i;

    for(i=0; i<10; i++)
    {
        total += square(i);
    }
    return 0;
}

比如需要对如上程序square参数i为5的时候断点，并在此时打印栈、局部变量以及total的值

编写gdb.init如下：

set logging on gdb.log


b square if i == 5
commands
  bt full
  i locals
  p total
  print "Hit break when i == 5"
end

在gdb shell中source gdb.init，然后r执行命令，结果如下：

可以看出断点在i==5的时候断住了，并且此时打印了正确的值。

1.2 运行

“gdb 命令”之后，run可以在gdb下运行命令；如果命令需要参数则跟在run之后。

如果需要断点在main()处，直接执行start就可以。

1.3 显示栈帧

如果遇到断点而暂停执行，或者coredump可以显示栈帧。

通过bt可以显示栈帧，bt full可以显示局部变量。

命令格式如下：

bt

bt full：不仅显示backtrace，还显示局部变量

bt N：显示开头N个栈帧

bt full N

bt --past-main [on|off]

1.4 显示变量

“print 变量”可以显示变量内容。

如果需要一行监控多个变量，可以通过p {var1, var2, var3}。

p *array@len--打印array开始的一段内存。

set {unsigned int}0x80000000=0x0--往某地址写入数据。

p *0x8000000--打印0x80000000地址内容。

如果要跟踪自动显示，可以使用display {var1, var2, var3}

1.5 显示寄存器

info reg可以显示寄存器内容。

在寄存器名之前加$可以显示寄存器内容，

p $寄存器：显示寄存器内容

p/x $寄存器：十六进制显示寄存器内容。

用x命令可以显示内容内容，“x/格式地址”。

x $pc：显示程序指针内容

x/i $pc：显示程序指针汇编。

x/10i $pc：显示程序指针之后10条指令。

x/128wx 0xfc207000：从0xfc20700开始以16进制打印128个word。

还可以通过disassemble指令来反汇编。

disassemble

disassemble 程序计数器：反汇编pc所在函数的整个函数。

disassemble addr-0x40,addr+0x40：反汇编addr前后0x40大小。

1.6 单步执行

单步执行有两个命令next和step，两者的区别是next遇到函数不会进入函数内部，step会执行到函数内部。

如果需要逐条汇编指令执行，可以分别使用nexti和stepi。

step/stepi/s/si <n steps>

next/nexti/n/ni <n steps>

另外finish表示运行到当前函数结束，until运行到指定位置，或当前函数结束。

finish

until/u location

1.7 继续执行

调试时，使用continue命令继续执行程序。程序遇到断电后再次暂停执行；如果没有断点，就会一直执行到结束。

continue：继续执行

continue 次数：继续执行一定次数。

1.8 监视点

要想找到变量在何处被改变，可以使用watch命令设置监视点watchpoint。

watch <表达式>：表达式发生变化时暂停运行

awatch <表达式>：表达式被访问、改变是暂停执行

rwatch <表达式>：表达式被访问时暂停执行

其他变种还包括watch expr [thread thread-id] [mask maskvalue]，其中mask需要架构支持。

GDB不能监控一个常量，比如watch 0x600850报错。

但是可以watch *(int *)0x600850。

1.9 改变变量的值

“通过set variable <变量>=<表达式>”来修改变量的值。

set $r0=xxx：设置r0寄存器的值为xxx。

1.10 生成内核转储文件

通过“generate-core-file”生成core.xxxx转储文件。

然后gdb ./main ./core.xxxx查看恢复的现场。

另一命令gcore可以从命令行直接生成内核转储文件。

gcore `pidof 命令`：无需停止正在执行的程序已获得转储文件。

1.11 attach到进程

如果程序已经运行，或者是调试陷入死循环而无法返回控制台进程，可以使用attach命令。

attach pid

通过ps aux可以查看进程的pid，然后使用bt查看栈帧。

以top为例操作步骤为：

1. ps -aux查看进程pid，为16974.

2. sudo gdb attach 16974，使用gdb 附着到top命令。

3. 使用bt full查看，当前栈帧。此时使用print等查看信息。

4. 还可以通过info proc查看进程信息。

1.12 反复执行

continue、step、stepi、next、nexti都可以指定重复执行的次数。

ignore 断点编号次数：可以忽略指定次数断点。

1.13 初始化文件

Linux环境下初始化文件为.gdbinit。

如果存在.gdbinit文件，gdb在启动的之前就将其作为命令文件运行。

初始化文件和命令文件执行顺序为：HOME/.gdbinit > 运行命令行选项 > ./.gdbinit > -x指定命令文件。

1.14 设置源码目录

调试过程中如果需要关联到源码，查看更详细的信息。

可以通过directory或者set substitute-path来制定源码目录。

1.15 TUI调试

TUI（TextUser Interface）为GDB调试的文本用户界面，可以方便地显示源代码、汇编和寄存器文本窗口。

源代码窗口和汇编窗口会高亮显示程序运行位置并以'>'符号标记。有两个特殊标记用于标识断点，第一个标记用于标识断点类型：

B：程序至少有一次运行到了该断点

b：程序没有运行到过该断点

H：程序至少有一次运行到了该硬件断点

h：程序没有运行到过该硬件断点

第二个标记用于标识断点使能与否:

+：断点使能Breakpointis enabled. -：断点被禁用Breakpointis disabled.

当调试程序时，源代码窗口、汇编窗口和寄存器窗口的内容会自动更新。

tui enable/disalbe--在gdb命令行中打开或关闭TUI。

layout asm/layout regs--显示汇编和regs窗口。

layout src/layout regs--显示源码和regs窗口

winheight name +count--增加name窗口count个单位大小。

winheight name -count--减小name窗口count个单位大小。

1.16 Catchpoint

catch可以根据某些类型事件来停止程序执行。

可以通过catch syscall close，捕捉产生系统调用close的时候停止程序执行。

其他的catch事件还包括，throw、syscall、assert、exception等等。

1.17 自定义脚本

命令行的入参可以通过argc和*argv获取。

1.17.0 注释、赋值、显示

# - 为脚本添加注释。

set - 为变量赋值，以$开头，以便区分gdb还是调试程序变量。

例如：set $x = 1

显示变量可以通过echo、printf。

1.17.1自定义命令

利用define命令可以自行定义命令，还可以使用document命令给自定义命令添加说明。

define adder
  if $argc == 2
    print $arg0 + $arg1
  end
  if $argc == 3
    print $arg0 + $arg1 + $arg2
  end
end

document adder
  Sum two or three variables.
end

执行bf自定义命令，结果如下。

无行参声明，但可以直接用$arg0,$arg1引用， $argc 为形参个数

1.17.2 条件语句

条件命令：if...else...end。这个同其它语言中提供的if命令没什么区别，只是注意结尾的end。

1.17.3 循环语句

循环命令：while...end。gdb同样提供了loop_break和loop_continue命令分别对应其它语言中的break和continue，另外同样注意结尾的end。

set logging on overwrite gdb.log------------将显示log保存到gdb.log中。
set pagination off--------------------------关闭分页显示功能。

tar jtag jtag://localhost:1025--------------连接上JTAG。

d-------------------------------------------删除现有断点。

b func_a------------------------------------在func_a增加断点。
commands------------------------------------断点后，执行如下命令。
  b func_b----------------------------------在func_a断点之后，在func_b增加断点。
    commands
      bt full-------------------------------打印func_b处栈帧。
      c-------------------------------------继续执行。
    end
  b file.c:555------------------------------在file.c的555行增加断点
    commands
      while 1-------------------------------无限执行next命令。
        next
      end
    end
  c-----------------------------------------继续执行，才会触发func_b和file.c:555断点。
end

c-------------------------------------------程序继续执行。

在命令行gdb -x gdb.init bin；或者gdb bin，然后在命令行soruce gdb.init同样可以更新脚本。

1.18 dump内存到指定文件

在gdb调试中可能需要将一段内存导出到文件中，可以借助dump命令。

命令格式：

dump binary memory FILE START STOP

比如dump binary memory ./dump.bin 0x0 0x008000000，将内存区间从0x0到0x00800000导出到dump.bin中。

1.19 load将文件加载到指定内存

当需要将某个文件加载到指定内存，通过load：

load filename offset

比如load file.bin 0x80000000，将file.bin文件加载到0x80000000中。

1.20 和target文件传输

通过remote put/get和target之间传输文件：

remote put hostfile targetfile

remote get targetfile hostfile

remote delete targetfile

2. gdb+gdbserver远程调试

目标板gdbserver+主机gdb远程调试的方式，比较适合目标板性能受限，只能提供gdbserver功能。

在主机上执行gdb进行远程调试。测试程序如下。

#include <stdio.h>

void C(int *p)
{
    *p = 0x12;
}

void B(int *p)
{
    C(p);
}
void A(int *p)
{
    B(p);
}
void A2(int *p)
{
    C(p);
}
int main(int argc, char **argv)
{
    int a;
    int *p = NULL;
    A2(&a);  // A2 > C
    printf("a = 0x%x\n", a);
    A(p);    // A > B > C
    return 0;
}

对目标板的设置方式是：开启端口2345作为gdbserver通信端口。

gdbserver :2345 test_debug

主机上执行gdb test_debug，然后tar remote 192.168.2.84.2345连接远程gdbserver。

目标板会收到“Remote debugging from host 192.168.33.77”消息，表示两者连接成功。

主机上就可以进行远程调试，continue之后两端得到的结果如下：

目标板输出“a=0x12”之后停止运行，。

主机上得到SIGSEGV，并可以查看backtrace信息。可以看出问题点在指针p指向NULL，0指针赋值错误。

如果要对已运行程序进行调试：

gdbserver --attach comm pid--将gdbserver附着到进程id为pid的comm程序。

detach--去附着。

disconnect--断开gdb连接。

3. 通过core+gdb离线分析

在目标板上执行ulimit -c unlimited，执行应用程序。

程序出错后，会在当前目录下生成core文件。

将core文件拷出后，再PC上执行xxx-linux-gdb ./test ./core进行分析。

3.1 加载库文件

在运行xxx-linux-gdb ./test ./core之后，可能存在库文件关联不上的情况。

使用info sharedlibrary，查看库加载情况。

From        To          Syms Read   Shared Object Library
                        No          xxx.so
                        No          /lib/libdl.so.2
                        No          /lib/libpthread.so.0
0x2ab6ec00  0x2ac09ba4  Yes         xxx/lib/libstdc++.so.6
                        No          /lib/libm.so.6
0x2acec460  0x2acf626c  Yes         xxx/lib/libgcc_s.so.1
                        No          /lib/libc.so.6
                        No          /lib/ld.so.1

可以通过set solib-search-path和set solib-absolute-prefix来设置，对应库所在的路径。

From        To          Syms Read   Shared Object Library
0x2aaca050  0x2aacc8d0  Yes         xxx.so
0x2aad0ad0  0x2aad17ac  Yes (*)     xxx/lib/libdl.so.2
0x2aad8a50  0x2aae7434  Yes (*)     xxx/lib/libpthread.so.0
0x2ab6ec00  0x2ac09ba4  Yes         xxx/lib/libstdc++.so.6
0x2ac4b3d0  0x2acb1988  Yes         xxx/lib/libm.so.6
0x2acec460  0x2acf626c  Yes         xxx/lib/libgcc_s.so.1
0x2ad17b80  0x2adf699e  Yes         xxx/lib/libc.so.6
0x2aaa89e0  0x2aabf66c  Yes (*)     xxx/lib/ld.so.1
(*): Shared library is missing debugging information.

可以看出相关库文件都已经加载，只是部分库文件没有调试信息。

3.2 查看backtrace

查看coredump的backtrace通过bt即可，更全的信息通过bt full。

产看函数调用栈的几个函数

bt：显示所有的函数调用栈帧的信息，每个帧一行。

bt n：显示栈定的n个帧信息。

bt -n：显示栈底的n个帧信息。

bt full：显示栈中所有帧的完全信息如：函数参数，本地变量。

bt full n：用法同上。

bt full -n

(gdb) bt
#0  0x2ad71f1e in memcpy () from xxx/lib/libc.so.6
#1  0x2ad71ac0 in memmove () from xxx/lib/libc.so.6
#2  0x0011f36c in std::__copy_move<false, true, std::random_access_iterator_tag>::__copy_m<unsigned char> (__first=0x34dfb008 "\377\330\377", <incomplete sequence \340>, __last=0x34eeea2c "", 
    ...
#3  0x0011ee22 in std::__copy_move_a<false, unsigned char*, unsigned char*> (__first=0x34dfb008 "\377\330\377", <incomplete sequence \340>, __last=0x34eeea2c "", __result=0x2b2013c0 "\377\330\377", <incomplete sequence \340>)
    at xxxinclude/c++/6.3.0/bits/stl_algobase.h:386
#4  0x0011e7e2 in std::__copy_move_a2<false, __gnu_cxx::__normal_iterator<unsigned char*, std::vector<unsigned char> >, unsigned char*> (__first=..., __last=..., __result=0x2b2013c0 "\377\330\377", <incomplete sequence \340>)
    at xxx/bits/stl_algobase.h:424
#5  0x0011dfd2 in std::copy<__gnu_cxx::__normal_iterator<unsigned char*, std::vector<unsigned char> >, unsigned char*> (__first=..., __last=..., __result=0x2b2013c0 "\377\330\377", <incomplete sequence \340>)
    at xxx/6.3.0/bits/stl_algobase.h:456
#6  0x0011c948 in xxx
#7  0x00133e08 in xxx
#8  0x2aada31e in start_thread () from xxx/libc/lib/libpthread.so.0
#9  0x005a11b4 in ?? ()

3.3 Core Dump核心转存储文件目录和命名规则

默认情况下core文件存在应用当前路径下，为了区分可以进行设置。

区分core主要通过/proc/sys/kernel/core_uses_pid和/proc/sys/kernel/core_pattern进行设置。

/proc/sys/kernel/core_uses_pid：可以控制产生的core文件的文件名中是否添加pid作为扩展，如果添加则文件内容为1，否则为0。

proc/sys/kernel/core_pattern：可以设置格式化的core文件保存位置或文件名，比如原来文件内容是core-%e

echo "/tmp/core-%e-%p" > core_pattern。

将会控制所产生的core文件会存放到/corefile目录下，产生的文件名为core-命令名-pid-时间戳

以下是参数列表:
    %p - insert pid into filename 添加pid
    %u - insert current uid into filename 添加当前uid
    %g - insert current gid into filename 添加当前gid
    %s - insert signal that caused the coredump into the filename 添加导致产生core的信号
    %t - insert UNIX time that the coredump occurred into filename 添加core文件生成时的unix时间
    %h - insert hostname where the coredump happened into filename 添加主机名
    %e - insert coredumping executable name into filename 添加命令名

当然，你可以用下列方式来完成：

sysctl -w kernel.core_pattern=/tmp/core-%e-%p

3.4 ulimit的使用

功能说明：控制shell程序的资源。

语　　法：ulimit [-aHS][-c <core文件上限>][-d <数据节区大小>][-f <文件大小>][-m <内存大小>][-n <文件数目>][-p <缓冲区大小>][-s <堆叠大小>][-t <CPU时间>][-u <程序数目>][-v <虚拟内存大小>]

补充说明：ulimit为shell内建指令，可用来控制shell执行程序的资源。

参　　数：
   -a 　显示目前资源限制的设定。
   -c <core文件上限> 　设定core文件的最大值，单位为区块。
   -d <数据节区大小> 　程序数据节区的最大值，单位为KB。
   -f <文件大小> 　shell所能建立的最大文件，单位为区块。
   -H 　设定资源的硬性限制，也就是管理员所设下的限制。
   -m <内存大小> 　指定可使用内存的上限，单位为KB。
   -n <文件数目> 　指定同一时间最多可开启的文件数。
   -p <缓冲区大小> 　指定管道缓冲区的大小，单位512字节。
   -s <堆叠大小> 　指定堆叠的上限，单位为KB。
   -S 　设定资源的弹性限制。
   -t <CPU时间> 　指定CPU使用时间的上限，单位为秒。
   -u <程序数目> 　用户最多可开启的程序数目。
   -v <虚拟内存大小> 　指定可使用的虚拟内存上限，单位为KB。

4. GDB小技巧

4.1 关闭 Type <return> to continue, or q <return> to quit---

当现实内容多的时候，GDB会强制分页，现实就会暂停。但是可能并不需要，可以通过set pagination off关闭。

4.2 附着到已运行kernel

在已运行的Linux上，如果发生死机异常等问题，这时候定位问题需要使用jtag连接上。

连接方法是：

gdb-----------------------------------------------进入gdb shell。
target remote localhost:1025-------------------在gdb shell中通过ip:port连接上target。
file vmlinux----------------------------------------加载符号表。

然后就可以在线查看运行状态了。

参考文档：

《Linux环境下段错误的产生原因及调试方法小结》《linux应用调试技术之GDB和GDBServer》《gdbServer + gdb 调试》

posted on 2018-09-16 22:45 ArnoldLu 阅读(119118) 评论(0) 收藏举报

刷新页面返回顶部