kernel segfault 段错误分析

 

参考链接:

 https://blog.csdn.net/jewelsu/article/details/99286161

 

如下这种段错误分析流程:

1 Nov 29 01:01:01 localhost systemd: Starting Session 41 of user root.
2 Nov 29 01:48:45 localhost kernel: lcore-slave-11[17899]: segfault at 7f6c9dfe8000 ip 000000000044618f sp 00007f6c9dfe1380 error 6 in restore[400000+f27000]
3 Nov 29 01:48:45 localhost systemd-logind: Removed session 18.

 

这种信息一般都是由内存访问越界造成的,不管是用户态程序还是内核态程序访问越界都会出core, 并在系统日志里面输出一条这样的信息。这条信息的前面分别是访问越界的程序名,进程ID号,访问越界的地址以及当时进程堆栈地址等信息,比较有用的信息是 最后的error number. 在上面的信息中,error number是4 ,下面详细介绍一下error number的信息:
在上面的例子中,error number是6, 转成二进制就是110, 即bit2=1, bit1=1, bit0=0, 按照上面的解释,我们可以得出这条信息是由于用户态程序读操作访问越界造成的。
error number是由三个字位组成的,从高到底分别为bit2 bit1和bit0,所以它的取值范围是0~7.

bit2: 值为1表示是用户态程序内存访问越界,值为0表示是内核态程序内存访问越界
bit1: 值为1表示是写操作导致内存访问越界,值为0表示是读操作导致内存访问越界
bit0: 值为1表示没有足够的权限访问非法地址的内容,值为0表示访问的非法地址根本没有对应的页面,也就是无效地址

根据segfault信息调试定位程序bug举例:

1 #includeint main(){        int *p;        *p=12;        return 1;}
2 
3 1. gcc testseg.c -o testseg -g,运行./testseg查看dmesg信息如下:
4     testseg[26063]: segfault at 0000000000000000 rip 0000000000400470 rsp 0000007fbffff8a0 error 6
5 2. 运行addr2line -e testseg 0000000000400470,输出如下:
6     /home/xxx/xxx/c/testseg.c:5 [...]

 

 

 

 

 

 

 

posted @ 2019-12-02 20:21  凌空a  阅读(2543)  评论(0编辑  收藏  举报