博客地址:http://home.cnblogs.com/u/zengjianrong/

疑难杂症定位记录

先列一下点,后面在补充解决过程

 

1. 某函数局部变量被串改(此局部变量存于寄存器)

2. 访问非法地址挂死(但死机位置没有load/store instructions)

3. 系统寄存器存储值异常(双物理cpu操作引起)

4. task stack 爆掉,在切换task时检测到栈顶第一个byte被修改,从而系统reboot

5. task堆栈使用情况跟踪,先将堆栈全部设为FFFFFFFF...,跑一段时间后,检查堆栈使用量。

6. 对于mips,在代码里面加断点:0x7000003f ;加死循环 disable_irq, 0x1000ffff。

7. 系统性能:

主频、中断、锁、uncache addr、task_sleep等

 

linux:

1. 系统调用后,应用被signal 11 强制杀死

(1)建立信号捕捉函数,捕捉到11时,打印寄存器信息。

(2)通过pc指针的值定位死机位置

(3)查看死机位置的相关地址值/指针值

(3)在死机位置所在函数的调用前,模拟访问非法地址,对比寄存器,看看寄存器是否有出现异常值

此次遇到的bug,是由于应用和内核结构体不对齐,导致在系统调用时内核访问越界,修改掉了fp寄存器,

导致局部变量的地址被篡改,从而引发应用内存访问越界,内核强制杀死应用。

2. 应用oom

posted @ 2017-04-27 16:16  black_man  阅读(301)  评论(0编辑  收藏  举报