Linux基础 30分钟GDB调试快速突破

引言 Linus心灵鸡汤

　　在*nix开发中有道卡叫gdb调试,不管你怎么搞. 它依然在那丝毫不会松动.今天致敬一个 活着的传奇 Linus Torvalds

　　Unix 始于上个世纪60年代，在70年代得到了迅猛的发展，

这时候的李纳斯还躺在祖父公寓的摇篮里睡大觉，如果不是后来 Unix 王国自乱阵脚，

出现阵营分裂和法律纠纷，可能 Linux 系统根本都不会出现。真实的情况是，

Unix 浪费了大把的时间和机会，似乎就是为了等待这个大鼻子、头发纷乱的芬兰小子长大，然后一决高下。

　　李纳斯赢得了自己的时间，他一刻不停的磨练自己的技艺，在清晨的微光中练习算法，

在赫尔辛基的雪山上编译代码，随时随地补充的粮草和武器。

二十一年之后，李纳斯抚着雪亮的刀锋上路了，他要去追寻属于程序员的最高荣耀。[

　　I simply know better than you, that's why I'm your god.

　　　　　　　　　　　　　　　　　　　　　- - Linus Torvalds

]

前言 gdb 开始调试开始上手

1. 开启core, 采集程序崩溃的状态

　　首先你跟着我做开启core崩溃状态采集. 可以通过 ulimit -c 查看如果是0表示没有开启. 开启按照下面操作

su root

vi /etc/profile
Shift + G
i
# No core files by default 0, unlimited is oo
ulimit -S -c unlimited > /dev/null 2>&1
wq!

source /etc/profile

上面shell 操作是在 /etc/profile 最后一行添加上面设置全局开启 core文件调试,大小不限. 最后立即生效.

再跟着我做, 因为生成的core文件同名会覆盖. 这里为其加上一个 core命名规则, 让其变成 [core.pid] 格式.

su root

vi /etc/sysctl.conf
Shift + G
i

# open, add core.pid 
kernel.core_pattern = ./core_%t_%p_%e
kernel.core_uses_pid = 1

wq!

sysctl -p /etc/sysctl.conf

在 /etc/sysctl.conf 文件中添加系统配置. 后面立即启用. 最后是下面状态表示core启用都搞好了.

(上面是ubuntu 15.10 环境中, 后面测试用的是centos 6.4)

2. 简单接触 GDB , 开始调试 r n p

第一个演示代码 heoo.c

#include <stdio.h>

int g_var = 0;

static int _add(int a, int b) {
    printf("_add callad, a:%d, b:%d\n", a, b);
    return a+b;
}

int main(void) {
    int n = 1;
    
    printf("one n=%d, g_var=%d\n", n, g_var);
    ++n;
    --n;
    
    g_var += 20;
    g_var -= 10;
    n = _add(1, g_var);
    printf("two n=%d, g_var=%d\n", n, g_var);
    
    return 0;
}

我们下面从图说起.(如果用视频说更好,文字和图意义在于查询方便.更简约)

第一个命令 gdb heoo.out 表示 gdb加载 heoo.out 开始调试. 如果需要使用gdb调试的话编译的时候 gcc 需要加上 -g命令.

其中l命令表示查看加载源码内容. 下面将演示如何加断点.

r 表示调试的程序开始运行.

p 命令表示打印值. n表示过程调试, 到下一步. 不管子过程如何都不进入. 直接一次跳过.

上面用的s 表示单步调试, 遇到子函数,会进入函数内部调试.

总结一下 . l 查看源码 , b 加断点, r 开始运行调试, n 下一步, s下一步但是会进入子函数. p 输出数据.

到这里gdb 基本会用了. 是不是也很容易. 直白. 小代码可以随便调试了.

看到这里基础知识普及完毕了. 后面可以不看了. 有机会再看. 好那我们接着扯.

正文第一部分 gdb其它开发中用的命令

　　开始扯一点, linux总是敲命令操作, 也很不安全. 有时候晕了. 写这样编译命令.

gcc -g -Wall -o heoo.c heoo.out

非常恐怖, heoo.c 代码删除了. heoo.out => heoo.c 先创建后生成失败退出. 原先的内容被抹掉了. 哈哈. 服务器开发, 经验不足, 熟练度不够.自己都怕自己.

1. gdb 其它常用命令用法 c q b info

首先看用到的调试文件 houge.c

#include <stdio.h>
#include <stdlib.h>
#include <time.h>

/*
 * arr 只能是数组
 * 返回当前数组长度
 */
#define LEN(arr) (sizeof(arr)/sizeof(*arr))

// 简单数组打印函数
static void _parrs(int a[], int len) {
    int i = -1;
    puts("当前数组内容值如下:");

    while(++i < len) 
        printf("%d ", a[i]);    
    putchar('\n');
}

// 简单包装宏, arr必须是数组
#define PARRS(arr) \
    _parrs(arr, LEN(arr))

#define _INT_OLD (23)

/*
 * 主函数,简单测试
 * 测试 core文件, 
 * 测试 宏调试
 * 测试 堆栈内存信息
 */
int main(void) {
    int i;
    int a[_INT_OLD];
    int* ptr = NULL;    

    // 来个随机数填充值吧
    srand((unsigned)time(NULL));
    for(i=0; i<LEN(a); ++i)
        a[i] = rand()%222;
    
    PARRS(a);

    //全员加double, 包含一个错误方便测试
    for(i=1; i<=LEN(a); ++i)
        a[i] <<= 1;
    PARRS(a);

    // 为了错,强制错
    *ptr = 0;

    return 0;
}

同样需要仔细看下面图中使用的命令. 首先对前言部分加深一些. 看下面

这个图是前言的补充, c跳过直到下一个断点处, q表示程序退出.

在 houge.c 中我们开始调试. 一运行段错误, 出现了我们的 core.pid 文件

通过 gdb houge.out core.27047 开始调试. 马上定位出来了错误原因.

2. 调试内存堆栈信息

刚开始 print a , 在main中当做数组处理.打印的信息多. 后面在_add函数中, a就是个形参数组地址.

主要看 info args 查看当前函数参数值

info locals 看当前函数栈上值信息, info registers 表示查看寄存器值.

后面查看内存信息 需要记得东西多一些. 先看图

x /23dw a 意思是查看从a地址开始 23个 4字节有符号十进制数输出.

关于x 更加详细见下面

用gdb查看内存格式: 
    x /nfu ptr

说明
x 是 examine 的缩写
n表示要显示的内存单元的个数

f表示显示方式, 可取如下值
x 按十六进制格式显示变量。
d 按十进制格式显示变量。
u 按十进制格式显示无符号整型。
o 按八进制格式显示变量。
t 按二进制格式显示变量。
a 按十六进制格式显示变量。
i 指令地址格式
c 按字符格式显示变量。
f 按浮点数格式显示变量。

u表示一个地址单元的长度
b表示单字节，
h表示双字节，
w表示四字节，
g表示八字节

Format letters are o(octal), x(hex), d(decimal), u(unsigned decimal),
t(binary), f(float), a(address), i(instruction), c(char) and s(string).
Size letters are b(byte), h(halfword), w(word), g(giant, 8 bytes)

ptr 表示从那个地址开始

这个命令常用于监测内存变化.调试中特别常用.

3. gdb 设置条件断点

很简单 b 17 if i == 8. 在17行设置一个断点,并且只有i==8的时候才会触发.

4. gdb 删除断点

gdb 删除有d 后面跟断点索引1,2,3..

clear 行数或名称. 删除哪一行断点. 看下面演示

到这里介绍的gdb调试技巧基本都够用了. 感觉用图形ide,例如vs调试也就用到这些了.

估计gdb调试突破20min过去了.够用了. 后面可以不用看了.

正文第二部分 gdb 多线程多进程调试

　　到这里实战中用的机会少了, 也就老鸟会用上些. 这部分可以调试,不好调试. 一般一调估计小半天就走了. 好,那我们处理最后10min.

1. 首先对上面正文第一部分加深 gdb调试宏

首先看上面命令

　　macro expand 宏(参数) => 得到宏导出内容.

　　info macro 宏名 => 宏定义内容

如果你需要用到上面gdb功能, 查看和导出宏的话.还需要gcc 支持,生成的时候加上 -ggdb3如下

gcc -Wall -ggdb3 -o houge.out houge.c

就可以使用了. 扩展一下对于 gcc 编译的有个过程叫做预编译 gcc -E -o *.i *.c.

这时候处理多数宏,直接展开, 也可以查看最后结果. 也算也是一个黑科技.

2. 开始多线程调试

首先看测试用例 dasheng.c

#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>

// 声明一个都用的量
static int _old;

// 线程跑的函数
static void* _run(void* arg) {
    int piyo = 10;    
    int n = *(int*)arg;
    int i;
    
    //设置线程分离
    pthread_detach(pthread_self());
    
    for(i=0; i<n; ++i) {
        printf("n=%d, i=%d\n", n, i);
        ++_old;
        printf("n=%d, piyo = %d, _old=%d\n", n, piyo, _old);
    }

    return NULL;
}

#define _INT_PTX (3)

int main(void) {
    int i, rt, j;
    pthread_t tx[_INT_PTX];

    puts("main beign");    

    for(i=0; i<_INT_PTX; ++i) {
        // &i 是有问题的, 但是这里为了测试, 可以乱搞
        rt = pthread_create(tx+i, NULL, _run, &i);
        if(rt < 0) {
            printf("pthread_create create error! rt = %d, i=%d\n", rt, i);
            break;
        }
    }

    //CPU忙等待
    for(j=0; j<1000000000; ++j)
        ;        
    puts("end");    

    return 0;
}

编译命令

gcc -Wall -g -o dasheng.out dasheng.c -lpthread

那先看下面测试图

上面 info threads 查看所有运行的线程信息. *表示当前调试的线程.

后面 l _run 表示查看 _run附近代码. 当然还有 l 16 查看16行附近文件内容.

gdb多线程切换测试如下

thread 3表示切换到第三个线程, info threads 第一列id 就是 thread 切换的id.

上面测试线程就算你切换到 thread 3. 其它线程还是在跑的. 我们用下面命令只让待调试的线程跑. 其它线程阻塞.

set scheduler-locking on 开始多线程单独调试. 不用了设置 set scheduler-locking off 关闭. 又会回到你调试这个, 其它线程不阻塞.

总结多线程调试常用就这三个实用命令

info threads

thread id

set scheduler-locking on/off

分别是查看,切换,设置同步调试.到这里多线程调试基本完毕了.

3. 开始gdb 多进程调试

首先看 liaobude.c 测试代码

#include <stdio.h>
#include <stdlib.h>
#include <errno.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

// 声明一个都用的量
static int _old;

// 线程跑的函数
static void _run(int n) {
    int piyo = 10;    
    int i;
    
    ++n;    
    for(i=0; i<n; ++i) {
        printf("n=%d, i=%d\n", n, i);
        ++_old;
        printf("n=%d, piyo = %d, _old=%d\n", n, piyo, _old);
    }
}

#define _INT_PTX (3)

int main(void) {
    int i;
    pid_t rt;

    puts("main beign");    

    for(i=0; i<_INT_PTX; ++i) {
        // &i 是有问题的, 但是这里为了测试, 可以乱搞
        rt = fork();
        if(rt < 0) {
            printf("fork clone error! rt = %d, i=%d\n", rt, i);
            break;
        }
        if(rt == 0) {
            _run(i);
            exit(EXIT_FAILURE);
        }
    }

    //等待子进程结束
　　for(;;) {
　　　　rt = waitpid(-1, NULL, WNOHANG);
　　　　if(rt>=0 || errno==EINTR)
　　　　　　continue;
　　　　break;
　　}   
    
    puts("end");    

    // 这里继续等待 
    for(i=0; i<190; ++i){
        printf("等待 有缘人[%d]!\n", i);
        sleep(1);
    }    

    return 0;
}

编译命令

gcc -Wall -g -o liaobude.out liaobude.c

其实对多进程调试, 先介绍一个常用的, 调试正在运行的程序. 首先让 ./liaobude.out 跑起来.

再通过 ps -ef 找到需要调试的进程. 复制进程文件描述符pid.

这时候启动gdb.

attach pid

gdb就把pid那个进程加载进来了. 加载的进程会阻塞到当前正在运行的地方. 直到使用命令控制. 这个功能还是非常猛的.

最后介绍进程调试的有关命令(需要最新的gdb才会支持). 多进程的调试思路和多线程调试流程很相似.

GDB可以同时调试多个程序。
只需要设置follow-fork-mode(默认值：parent)和detach-on-fork（默认值：on）即可。

   设置方法：set follow-fork-mode [parent|child]   set detach-on-fork [on|off]

   查询正在调试的进程：info inferiors
   切换调试的进程： inferior <infer number>

具体的意思有

set follow-fork-mode [parent|child] set detach-on-fork [on|off]

parent                   on               只调试主进程（gdb默认）
child               on               只调试子进程
parent                 off              同时调试两个进程，gdb跟主进程，子进程block在fork位置
child                 off              同时调试两个进程，gdb跟子进程，主进程block在fork位置

更加详细的 gdb 多进程调试demo 可以参照 http://blog.csdn.net/pbymw8iwm/article/details/7876797

使用方式和线程调试思路是一样的. 就是gdb 的命令换了字符. 工作中多进程调试遇到少.

遇到了很少用gdb调试. 会用下面2种调试好办法

2) 写单元测试

3) 打日志检测日志,分析

到这里 gdb30分钟内容讲解完毕. 多试试写写练一练, gdb基本突破没有问题.

后记

　　错误是难免的, 有问题可以随时交流. 拜~~, 周六下午愉快. 希望明天仍然是个好天气~~