疑难杂症定位记录
先列一下点,后面在补充解决过程
1. 某函数局部变量被串改(此局部变量存于寄存器)
2. 访问非法地址挂死(但死机位置没有load/store instructions)
3. 系统寄存器存储值异常(双物理cpu操作引起)
4. task stack 爆掉,在切换task时检测到栈顶第一个byte被修改,从而系统reboot
5. task堆栈使用情况跟踪,先将堆栈全部设为FFFFFFFF...,跑一段时间后,检查堆栈使用量。
6. 对于mips,在代码里面加断点:0x7000003f ;加死循环 disable_irq, 0x1000ffff。
7. 系统性能:
主频、中断、锁、uncache addr、task_sleep等
linux:
1. 系统调用后,应用被signal 11 强制杀死
(1)建立信号捕捉函数,捕捉到11时,打印寄存器信息。
(2)通过pc指针的值定位死机位置
(3)查看死机位置的相关地址值/指针值
(3)在死机位置所在函数的调用前,模拟访问非法地址,对比寄存器,看看寄存器是否有出现异常值
此次遇到的bug,是由于应用和内核结构体不对齐,导致在系统调用时内核访问越界,修改掉了fp寄存器,
导致局部变量的地址被篡改,从而引发应用内存访问越界,内核强制杀死应用。
2. 应用oom