MRS_关于HardFault问题查找思路
前言:
不少工程师在项目开发过程中会遇到代码运行进HardFault_Handler中断的情况。因进HardFault_Handler中断的原因(RAM溢出/空指针异常/堆栈溢出等等)比较多,情况比较复杂,搞得工程师没有头绪。现提供排查思路如下:
HardFault_Handler定位:
可在void HardFault_Handler(void)中断服务函数中添加如下代码:
printf("mepc :%08x\r\n", __get_MEPC());
printf("mcause:%08x\r\n", __get_MCAUSE());
printf("mtval :%08x\r\n", __get_MTVAL());
while(1);
该操作仅适用于代码串口可用的情况下,如串口不可用但可以仿真,也可通过仿真查看__get_MEPC();__get_MCAUSE();__get_MTVAL();三个函数的返回值。
串口呈现方式:(图一)
仿真呈现方式:(图二)
仿真操作可参考该帖:
https://blog.csdn.net/qq_36353650/article/details/120441264?spm=1001.2014.3001.5502
https://blog.csdn.net/qq_36353650/article/details/120665601?spm=1001.2014.3001.5502
关于三个函数返回值的介绍:
MCAUSE:反映当前的异常种类或中断的编号,mcause[31]=1 表示为中断,mcause[31]=0 表示为异常。本文仅分析mcause[31]=0的情况。
表一异常编码
MEPC:机器模式异常指针寄存器,标准定义退出异常或中断后微处理器的返回地址保存在MEPC中。所以当发生异常或中断后,硬件自动更新MEPC 值为当前遇到异常时的指令PC 值,或中断前下一条预执行的指令PC值。
MTVAL:该值即为引起异常的值,有以下几种情况:
- 1.如果存储器访问引起的异常,硬件会将异常时存储器访问的地址存入mtval。
- 2.如果是非法指令引起的异常,硬件会将该指令的指令编码存入mtval。
- 3.如果是硬件断点引起的异常,硬件会将断点处PC值存入mtval。
- 4.对于其他的异常,硬件将mtval的值设为0,例如ebreak,ecall 指令引起的异常。
- 5.进入中断时,硬件将mtval的值设为0。
综上所述,我们可以通过MEPC的值确定代码进HardFault_Handler中断的位置,在某些情况下可以方便我们确定报错原因。本文提供两种方法:
方法一 仿真法:
以上文图一呈现的HardFault报错信息为例,由打印信息或仿真信息可知MEPC=0x92c,且mcause[31]=0,因此触发HardFault为异常而不是中断,出现异常的PC指针地址为0x92c。我们可以仿真时在0x92c处打断点,如图所示:(图三)
然后全速运行,代码就会停在出错位置附近,如图所示:(图四)
方法二 查表法:可在所在工程的.lst文件中搜索MEPC值,即该案例中的92c,如图:(图五)
由lst文件可知报错函数为printf("%x ",*(uint16_t*)( buf+i));如果你是汇编大佬也可以分析一下这段代码,相信你也可以分析出报错原因。如果不是也不要灰心,可以继续往下看。
HardFault_Handler报错原因分析:
由上文可知报错原因可以通过MCAUSE与MTVAL确定,该案例中MCAUSE=4,MTVAL=20000ca1。
由表一可知该案例的报错原因为Load指令访存地址不对齐,结合MTVAL的情况1可知异常时存储器访问的地址为0x20000ca1(RAM地址)。结合代码可知,该问题是由于定义的数组为8位,但通过16位访问造成的。
注:如果通过仿真的方式查找问题且应用中有读写FLASH/低功耗/看门狗等操作,需将相关代码注释然后再仿真,否则将无法仿真。本文只是提供了一个查找HardFault_Handler问题的思路,实际情况可能比案例要复杂的多。可根据实际情况灵活处理。