c - 随机硬故障 - STM32F4 - FreeRTOS

标签 c stm32 freertos stm32f4

我有一个带有运行 FreeRTOS 的 STM32F4 的开发板(上面有 3 个任务),我每使用 15-50 分钟就会遇到一次 HardFault。

我的硬件: 3 个编码器、6 个模拟输入、10 个数字输入和 3 个用于直流电机的 PWM 输出。

一开始,我以为是一些 StackOverflow,然后我为每个任务实现了 uxTaskGetStackHighWaterMark(); 并检查它不是它。

然后我实现了一些 HardFault 处理程序:

   void HardFault_Handler(void)
{
    __asm volatile
    (
            " tst lr, #4                                                \n"
            " ite eq                                                    \n"
            " mrseq r0, msp                                             \n"
            " mrsne r0, psp                                             \n"
            " ldr r1, [r0, #24]                                         \n"
            " ldr r2, handler2_address_const                            \n"
            " bx r2                                                     \n"
            " handler2_address_const: .word prvGetRegistersFromStack    \n"
    );
}

void prvGetRegistersFromStack( uint32_t *pulFaultStackAddress )
{
    volatile uint32_t CFSRValue = SCB->CFSR;
    volatile uint32_t HFSRValue = SCB->HFSR;
    char stepError [100] = "";
    if ((HFSRValue & (1 << 30)) != 0) {
        CFSRValue >>= 16;
        if((CFSRValue & (1 << 9)) != 0) strcpy(stepError," Divide by zero");
        if((CFSRValue & (1 << 8)) != 0) strcpy(stepError," Unaligned access");
        if((CFSRValue & (1 << 3)) != 0) strcpy(stepError," No coprocessor UsageFault" );
        if((CFSRValue & (1 << 2)) != 0) strcpy(stepError," Invalid PC load UsageFault");
        if((CFSRValue & (1 << 1)) != 0) strcpy(stepError," Invalid state");
        if((CFSRValue & (1 << 0)) != 0) strcpy(stepError," Undefined instruction");
    }

    volatile uint32_t r0;
    volatile uint32_t r1;
    volatile uint32_t r2;
    volatile uint32_t r3;
    volatile uint32_t r12;
    volatile uint32_t lr; /* Link register. */
    volatile uint32_t pc; /* Program counter. */
    volatile uint32_t psr;/* Program status register. */

    r0 = pulFaultStackAddress[ 0 ];
    r1 = pulFaultStackAddress[ 1 ];
    r2 = pulFaultStackAddress[ 2 ];
    r3 = pulFaultStackAddress[ 3 ];

    r12 = pulFaultStackAddress[ 4 ];
    lr = pulFaultStackAddress[ 5 ]; 
    pc = pulFaultStackAddress[ 6 ];
    psr = pulFaultStackAddress[ 7 ];
    GPIO_WriteLed(0,1);
    for(int i=0;i<=10;i++)
    {
        PWM_Change_DutyCycle(i,0);
    }
    for(;;);
}

从这个实现中,我得到了这些结果(每个都是 HardFault,有时 PC 为 0),这些结果(对我来说)看起来非常随机:

1- if((CFSRValue & (1 << 1)) != 0) strcpy(stepError," Invalid state"); pc=0

2- if((CFSRValue & (1 << 0)) != 0) strcpy(stepError," Undefined instruction");
    0800807d: ...IncrementTick+252   ldr     r3, [r7, #8]   -  pc=134250621 - lr=2779096485


3-  if((CFSRValue & (1 << 8)) != 0) strcpy(stepError," Unaligned access");
    0800d63b: MX_ADC1_Init+290       ldr     r3, [pc, #240]  ; (0x800d72c <MX_ADC1_Init+532>)


4-  if((CFSRValue & (1 << 1)) != 0) strcpy(stepError," Invalid state");
        addr 0

5-080124c9: SysTick_Handler+8      bl      0x80072cc <osSystickHandler>


6-  if((CFSRValue & (1 << 0)) != 0) strcpy(stepError," Undefined instruction");
    08012521: SysTick_Handler+8      bl      0x80072cc <osSystickHandler>

问候,

最佳答案

  1. 这个问题没有明确说明,但据我了解,这个帖子不是关于硬故障的来源,而是关于到目前为止所显示的测试想法是否正常,并且还可以做些什么来定位错误。

  2. 这个问题现在已经很老了,但是这个板是为了帮助其他有同样问题的人,所以让我们带着对这些问题的普遍兴趣来阅读问答。


为了追溯问题,以下策略可以提供帮助:

  • 如果您可以应用跟踪硬件(因为硬件目标支持它并且您有足够的昂贵设备......),请使用它:片外 ETM 跟踪和硬件中的经典断点错误处理程序,您的搜索可能会在 50 分钟后结束。

    我想目前的情况不满足条件。 尽管如此,在一些专业项目中,设计另一个 PCB 并购买一个好的调试/跟踪适配器比让一些开发人员搜索数周要便宜。 也许具有完整 JTAG/TPIU 访问权限的 STM32 评估板是您的部分解决方案...

  • 有很多错误模型,其中硬故障处理程序报告给您的地址与错误源无关。 不过,通过检查(使用内存映射)地址属于哪个函数或变量/缓冲区,您可能会得到一些有用的想法。 通过在模块之间放置未使用的“间隔”缓冲区(一个或几个字可能就足够了)来修改错误环境,然后重新运行测试。 如果您将一些魔术模式写入这些未使用的区域,您可以监视它们是否损坏并将它们用作“canaries”以检测错误发生在哪个上下文中。

  • 如果这没有帮助,请逐步停用软件的不同组件,然后重新运行并检查硬故障何时消失。 如果之前还没有,您可能需要一些自动化的耐久性测试环境,这样您的工作(和搜索时间)就不会激增。

  • 据我所知,所有 STM32F4 有一个内存保护单元。 可以激活吗?

关于c - 随机硬故障 - STM32F4 - FreeRTOS,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47798960/

相关文章:

c - 用 C 写一个 shell,不返回任何东西

c - 带有 LibOpenCM3 的 STM32 FreeRTOS

c - FreeRTOS 应用程序堆栈可用内存随着时间的推移而减少

c - 使用 HAL 时如何删除 STM32F405RG 中的内部闪存页面(不是扇区!)?

arm - PWM DMA 到整个 GPIO

c - FreeRTOS - STM32F4 上的堆栈损坏

c++ - 为什么断言宏仅用于调试构建

c - 同一项目下不同源文件中的两个main()

c - 了解警告 "comparison of promoted ~unsigned with unsigned"

stm32 - FreeRTOS 任务优先级和堆栈大小