我有一个带有运行 FreeRTOS 的 STM32F4 的开发板(上面有 3 个任务),我每使用 15-50 分钟就会遇到一次 HardFault。
我的硬件: 3 个编码器、6 个模拟输入、10 个数字输入和 3 个用于直流电机的 PWM 输出。
一开始,我以为是一些 StackOverflow,然后我为每个任务实现了 uxTaskGetStackHighWaterMark();
并检查它不是它。
然后我实现了一些 HardFault 处理程序:
void HardFault_Handler(void)
{
__asm volatile
(
" tst lr, #4 \n"
" ite eq \n"
" mrseq r0, msp \n"
" mrsne r0, psp \n"
" ldr r1, [r0, #24] \n"
" ldr r2, handler2_address_const \n"
" bx r2 \n"
" handler2_address_const: .word prvGetRegistersFromStack \n"
);
}
void prvGetRegistersFromStack( uint32_t *pulFaultStackAddress )
{
volatile uint32_t CFSRValue = SCB->CFSR;
volatile uint32_t HFSRValue = SCB->HFSR;
char stepError [100] = "";
if ((HFSRValue & (1 << 30)) != 0) {
CFSRValue >>= 16;
if((CFSRValue & (1 << 9)) != 0) strcpy(stepError," Divide by zero");
if((CFSRValue & (1 << 8)) != 0) strcpy(stepError," Unaligned access");
if((CFSRValue & (1 << 3)) != 0) strcpy(stepError," No coprocessor UsageFault" );
if((CFSRValue & (1 << 2)) != 0) strcpy(stepError," Invalid PC load UsageFault");
if((CFSRValue & (1 << 1)) != 0) strcpy(stepError," Invalid state");
if((CFSRValue & (1 << 0)) != 0) strcpy(stepError," Undefined instruction");
}
volatile uint32_t r0;
volatile uint32_t r1;
volatile uint32_t r2;
volatile uint32_t r3;
volatile uint32_t r12;
volatile uint32_t lr; /* Link register. */
volatile uint32_t pc; /* Program counter. */
volatile uint32_t psr;/* Program status register. */
r0 = pulFaultStackAddress[ 0 ];
r1 = pulFaultStackAddress[ 1 ];
r2 = pulFaultStackAddress[ 2 ];
r3 = pulFaultStackAddress[ 3 ];
r12 = pulFaultStackAddress[ 4 ];
lr = pulFaultStackAddress[ 5 ];
pc = pulFaultStackAddress[ 6 ];
psr = pulFaultStackAddress[ 7 ];
GPIO_WriteLed(0,1);
for(int i=0;i<=10;i++)
{
PWM_Change_DutyCycle(i,0);
}
for(;;);
}
从这个实现中,我得到了这些结果(每个都是 HardFault,有时 PC 为 0),这些结果(对我来说)看起来非常随机:
1- if((CFSRValue & (1 << 1)) != 0) strcpy(stepError," Invalid state"); pc=0
2- if((CFSRValue & (1 << 0)) != 0) strcpy(stepError," Undefined instruction");
0800807d: ...IncrementTick+252 ldr r3, [r7, #8] - pc=134250621 - lr=2779096485
3- if((CFSRValue & (1 << 8)) != 0) strcpy(stepError," Unaligned access");
0800d63b: MX_ADC1_Init+290 ldr r3, [pc, #240] ; (0x800d72c <MX_ADC1_Init+532>)
4- if((CFSRValue & (1 << 1)) != 0) strcpy(stepError," Invalid state");
addr 0
5-080124c9: SysTick_Handler+8 bl 0x80072cc <osSystickHandler>
6- if((CFSRValue & (1 << 0)) != 0) strcpy(stepError," Undefined instruction");
08012521: SysTick_Handler+8 bl 0x80072cc <osSystickHandler>
问候,
最佳答案
这个问题没有明确说明,但据我了解,这个帖子不是关于硬故障的来源,而是关于到目前为止所显示的测试想法是否正常,并且还可以做些什么来定位错误。
这个问题现在已经很老了,但是这个板是为了帮助其他有同样问题的人,所以让我们带着对这些问题的普遍兴趣来阅读问答。
为了追溯问题,以下策略可以提供帮助:
如果您可以应用跟踪硬件(因为硬件目标支持它并且您有足够的昂贵设备......),请使用它:片外 ETM 跟踪和硬件中的经典断点错误处理程序,您的搜索可能会在 50 分钟后结束。
我想目前的情况不满足条件。 尽管如此,在一些专业项目中,设计另一个 PCB 并购买一个好的调试/跟踪适配器比让一些开发人员搜索数周要便宜。 也许具有完整 JTAG/TPIU 访问权限的 STM32 评估板是您的部分解决方案...
有很多错误模型,其中硬故障处理程序报告给您的地址与错误源无关。 不过,通过检查(使用内存映射)地址属于哪个函数或变量/缓冲区,您可能会得到一些有用的想法。 通过在模块之间放置未使用的“间隔”缓冲区(一个或几个字可能就足够了)来修改错误环境,然后重新运行测试。 如果您将一些魔术模式写入这些未使用的区域,您可以监视它们是否损坏并将它们用作“canaries”以检测错误发生在哪个上下文中。
如果这没有帮助,请逐步停用软件的不同组件,然后重新运行并检查硬故障何时消失。 如果之前还没有,您可能需要一些自动化的耐久性测试环境,这样您的工作(和搜索时间)就不会激增。
据我所知,所有 STM32F4 有一个内存保护单元。 可以激活吗?
关于c - 随机硬故障 - STM32F4 - FreeRTOS,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47798960/