RTOS内存管理策略：深入理解动态内存分配与优化¶

学习目标¶

完成本教程后，你将能够：

理解RTOS内存管理的核心概念和挑战
掌握不同内存分配方案的特点和适用场景
学会设计和实现内存池管理系统
理解堆管理的原理和优化方法
掌握内存碎片的产生原因和解决方案
能够根据应用需求选择合适的内存管理策略
学会分析和优化内存使用效率

前置要求¶

知识要求¶

理解RTOS的基本概念和任务管理
掌握C语言的指针和内存操作
了解裸机程序的内存管理基础
理解堆栈的概念和区别

技能要求¶

能够创建和管理RTOS任务
熟悉C语言的动态内存分配（malloc/free）
了解内存对齐的概念
掌握基本的调试技巧

环境要求¶

STM32开发板（或其他支持FreeRTOS的开发板）
STM32CubeIDE或Keil MDK开发环境
FreeRTOS源码或HAL库
串口调试工具

准备工作¶

硬件准备¶

硬件	数量	说明
STM32开发板	1	如STM32F407、STM32F103等
USB数据线	1	用于下载和供电
调试器	1	ST-Link或J-Link（可选）

软件准备¶

安装开发环境
STM32CubeIDE v1.10或更高版本
或Keil MDK v5.30或更高版本
配置FreeRTOS
在STM32CubeMX中启用FreeRTOS
配置堆大小和内存管理方案
配置串口
配置UART用于调试输出
波特率：115200
数据位：8，停止位：1，无校验

环境配置¶

// FreeRTOSConfig.h 关键配置
#define configUSE_PREEMPTION                1
#define configTOTAL_HEAP_SIZE              ((size_t)(20 * 1024))  // 20KB堆空间
#define configMINIMAL_STACK_SIZE           ((uint16_t)128)
#define configMAX_PRIORITIES               7
#define configUSE_MALLOC_FAILED_HOOK       1  // 启用内存分配失败钩子
#define configCHECK_FOR_STACK_OVERFLOW     2  // 启用堆栈溢出检测
#define configTICK_RATE_HZ                 1000

概述¶

什么是RTOS内存管理？¶

**RTOS内存管理**是指在实时操作系统中对RAM资源进行分配、使用和回收的机制。与裸机程序不同，RTOS需要为多个任务、队列、信号量等对象动态分配内存。

生活中的类比：

想象一个图书馆的书架管理： - 静态分配：每个读者有固定的书架位置（编译时确定） - 动态分配：根据需要临时分配书架空间（运行时分配） - 内存池：预留一些固定大小的书架格子（快速分配） - 内存碎片：书架上有很多小空隙，无法放大书（空间浪费）

为什么RTOS需要特殊的内存管理？¶

在RTOS环境中，内存管理面临特殊挑战：

挑战1：实时性要求

// 标准malloc可能耗时不确定
void *ptr = malloc(100);  // 可能需要几微秒到几毫秒
// 在实时系统中，这种不确定性是不可接受的

挑战2：内存碎片

初始状态：[████████████████████████] 24KB连续空间

分配后：  [A][B][C][D][E][F][G][H]
释放后：  [A][ ][C][ ][E][ ][G][ ]  碎片化

问题：虽然有12KB空闲，但无法分配8KB连续空间

挑战3：线程安全

// 多个任务同时分配内存
void Task1(void *param) {
    void *ptr1 = malloc(100);  // 可能与Task2冲突
}

void Task2(void *param) {
    void *ptr2 = malloc(200);  // 需要互斥保护
}

挑战4：资源受限

典型MCU资源：
- Flash: 64KB - 512KB
- RAM: 8KB - 128KB

RTOS开销：
- 内核：2-4KB
- 每个任务栈：128-512B
- 队列、信号量等：几十到几百字节

可用堆空间：通常只有几KB到几十KB

RTOS内存管理的目标¶

确定性：分配和释放时间可预测
高效性：最小化内存浪费和碎片
安全性：避免内存泄漏和越界访问
可靠性：处理分配失败的情况
简单性：API简单易用，易于调试

核心概念¶

内存布局¶

典型的RTOS内存布局：

高地址
┌─────────────────────┐
│   未使用的RAM       │
├─────────────────────┤
│   堆(Heap)          │ ← 动态分配区域
│   ↓ 向下增长        │
├─────────────────────┤
│   任务栈            │
│   Task3 Stack       │
├─────────────────────┤
│   Task2 Stack       │
├─────────────────────┤
│   Task1 Stack       │
├─────────────────────┤
│   全局变量/静态变量 │
│   (已初始化)        │
├─────────────────────┤
│   BSS段             │
│   (未初始化变量)    │
├─────────────────────┤
│   代码段(Flash)     │
└─────────────────────┘
低地址

内存分配类型¶

1. 静态分配¶

特点： - 编译时确定大小和位置 - 不需要运行时分配 - 不会产生碎片 - 内存使用固定

示例：

// 静态分配任务栈
static StackType_t task1_stack[256];
static StaticTask_t task1_tcb;

// 创建静态任务
TaskHandle_t task1_handle = xTaskCreateStatic(
    Task1_Function,
    "Task1",
    256,
    NULL,
    1,
    task1_stack,
    &task1_tcb
);

// 静态分配队列
static uint8_t queue_storage[10 * sizeof(uint32_t)];
static StaticQueue_t queue_struct;

QueueHandle_t queue = xQueueCreateStatic(
    10,
    sizeof(uint32_t),
    queue_storage,
    &queue_struct
);

优点： - 分配时间为零（编译时完成） - 不会失败（编译时检查） - 不产生碎片 - 适合安全关键应用

缺点： - 灵活性差 - 可能浪费内存 - 需要预先知道所有需求

2. 动态分配¶

特点： - 运行时分配和释放 - 灵活性高 - 可能产生碎片 - 需要管理分配失败

示例：

// 动态分配任务
TaskHandle_t task_handle;
xTaskCreate(
    Task_Function,
    "Task",
    256,          // 栈大小
    NULL,
    1,
    &task_handle
);

// 动态分配队列
QueueHandle_t queue = xQueueCreate(10, sizeof(uint32_t));

// 动态分配内存
void *buffer = pvPortMalloc(1024);
if(buffer != NULL) {
    // 使用内存
    vPortFree(buffer);  // 释放内存
}

优点： - 灵活性高 - 按需分配，节省内存 - 适合动态场景

缺点： - 分配时间不确定 - 可能失败 - 可能产生碎片 - 需要管理生命周期

内存对齐¶

为什么需要对齐？

// 未对齐访问（某些架构会出错或性能下降）
uint32_t *ptr = (uint32_t *)0x10000001;  // 地址不是4的倍数
uint32_t value = *ptr;  // 可能出错或需要多次访问

// 对齐访问（推荐）
uint32_t *ptr = (uint32_t *)0x10000000;  // 地址是4的倍数
uint32_t value = *ptr;  // 一次访问完成

对齐规则： - 1字节数据：任意地址 - 2字节数据：地址必须是2的倍数 - 4字节数据：地址必须是4的倍数 - 8字节数据：地址必须是8的倍数

FreeRTOS的对齐处理：

// FreeRTOS自动处理对齐
#define portBYTE_ALIGNMENT  8  // 8字节对齐

// 分配的内存自动对齐
void *ptr = pvPortMalloc(100);  // 返回的地址是8的倍数

FreeRTOS内存管理方案¶

FreeRTOS提供了5种内存管理方案（heap_1到heap_5），每种方案有不同的特点和适用场景。

方案1：heap_1（只分配不释放）¶

特点¶

最简单：只支持分配，不支持释放
确定性强：分配时间固定
无碎片：线性分配，不会产生碎片
适合静态系统：所有对象在启动时创建

工作原理¶

初始状态：
┌────────────────────────────────┐
│     可用堆空间 (20KB)          │
└────────────────────────────────┘
 ↑
 pucAlignedHeap

分配100字节后：
┌──────┬─────────────────────────┐
│ 已用 │   剩余空间 (19.9KB)     │
└──────┴─────────────────────────┘
        ↑
        pucAlignedHeap + 100

继续分配200字节：
┌──────┬──────┬──────────────────┐
│ 100B │ 200B │  剩余 (19.7KB)   │
└──────┴──────┴──────────────────┘
               ↑
               pucAlignedHeap + 300

实现示例¶

// heap_1.c 简化实现
static uint8_t ucHeap[configTOTAL_HEAP_SIZE];
static size_t xNextFreeByte = 0;

void *pvPortMalloc(size_t xWantedSize) {
    void *pvReturn = NULL;

    // 进入临界区
    vTaskSuspendAll();
    {
        // 对齐处理
        if(xWantedSize & portBYTE_ALIGNMENT_MASK) {
            xWantedSize += (portBYTE_ALIGNMENT - 
                           (xWantedSize & portBYTE_ALIGNMENT_MASK));
        }

        // 检查是否有足够空间
        if((xNextFreeByte + xWantedSize) < configTOTAL_HEAP_SIZE) {
            pvReturn = &(ucHeap[xNextFreeByte]);
            xNextFreeByte += xWantedSize;
        }
    }
    xTaskResumeAll();

    return pvReturn;
}

void vPortFree(void *pv) {
    // heap_1不支持释放，什么都不做
}

使用场景¶

// 适合场景：所有对象在启动时创建，运行期间不再创建/删除
int main(void) {
    // 系统初始化
    SystemInit();

    // 创建所有任务（只在启动时创建）
    xTaskCreate(Task1, "Task1", 256, NULL, 1, NULL);
    xTaskCreate(Task2, "Task2", 256, NULL, 1, NULL);
    xTaskCreate(Task3, "Task3", 256, NULL, 1, NULL);

    // 创建所有队列
    queue1 = xQueueCreate(10, sizeof(uint32_t));
    queue2 = xQueueCreate(20, sizeof(uint8_t));

    // 创建所有信号量
    sem1 = xSemaphoreCreateBinary();
    sem2 = xSemaphoreCreateMutex();

    // 启动调度器（之后不再分配内存）
    vTaskStartScheduler();

    while(1);
}

优点： - 实现简单，代码量小 - 分配速度快，时间确定 - 不会产生碎片 - 适合安全关键应用

缺点： - 不支持释放内存 - 不适合动态创建/删除对象的场景 - 可能浪费内存

方案2：heap_2（支持释放但会产生碎片）¶

特点¶

支持释放：可以释放内存
最佳匹配：使用最佳匹配算法
会产生碎片：不会合并相邻空闲块
已过时：不推荐使用，建议用heap_4

工作原理¶

初始状态：
┌────────────────────────────────┐
│     空闲块 (20KB)              │
└────────────────────────────────┘

分配A(100B), B(200B), C(150B)：
┌───┬───┬───┬────────────────────┐
│ A │ B │ C │   空闲 (19.55KB)   │
└───┴───┴───┴────────────────────┘

释放B：
┌───┬───┬───┬────────────────────┐
│ A │空 │ C │   空闲 (19.55KB)   │
└───┴───┴───┴────────────────────┘
    ↑
    200B空闲块（不会与后面的空闲块合并）

问题：如果需要分配250B，虽然总空闲空间足够，
但没有单个连续的250B空间

数据结构¶

// 空闲块链表节点
typedef struct A_BLOCK_LINK {
    struct A_BLOCK_LINK *pxNextFreeBlock;  // 下一个空闲块
    size_t xBlockSize;                      // 块大小
} BlockLink_t;

// 空闲块链表（按大小排序）
static BlockLink_t xStart;  // 链表头
static BlockLink_t *pxEnd = NULL;  // 链表尾

分配算法¶

void *pvPortMalloc(size_t xWantedSize) {
    BlockLink_t *pxBlock, *pxPreviousBlock, *pxNewBlockLink;
    void *pvReturn = NULL;

    vTaskSuspendAll();
    {
        // 遍历空闲链表，找到第一个足够大的块（最佳匹配）
        pxPreviousBlock = &xStart;
        pxBlock = xStart.pxNextFreeBlock;

        while((pxBlock->xBlockSize < xWantedSize) && 
              (pxBlock->pxNextFreeBlock != NULL)) {
            pxPreviousBlock = pxBlock;
            pxBlock = pxBlock->pxNextFreeBlock;
        }

        if(pxBlock != pxEnd) {
            // 找到合适的块
            pvReturn = (void *)(((uint8_t *)pxPreviousBlock->pxNextFreeBlock) 
                               + xHeapStructSize);

            // 从空闲链表中移除
            pxPreviousBlock->pxNextFreeBlock = pxBlock->pxNextFreeBlock;

            // 如果剩余空间足够大，分割块
            if((pxBlock->xBlockSize - xWantedSize) > heapMINIMUM_BLOCK_SIZE) {
                // 创建新的空闲块
                pxNewBlockLink = (void *)(((uint8_t *)pxBlock) + xWantedSize);
                pxNewBlockLink->xBlockSize = pxBlock->xBlockSize - xWantedSize;
                pxBlock->xBlockSize = xWantedSize;

                // 插入新块到空闲链表
                prvInsertBlockIntoFreeList(pxNewBlockLink);
            }
        }
    }
    xTaskResumeAll();

    return pvReturn;
}

优点： - 支持内存释放 - 分配速度较快 - 实现相对简单

缺点： - 会产生碎片（不合并相邻空闲块） - 不适合频繁分配/释放的场景 - 已被heap_4取代

方案3：heap_3（封装标准库malloc/free）¶

特点¶

使用标准库：直接使用malloc/free
线程安全：添加了互斥保护
依赖编译器：行为取决于编译器实现
不确定性：分配时间不可预测

实现¶

// heap_3.c 实现
void *pvPortMalloc(size_t xWantedSize) {
    void *pvReturn;

    // 挂起调度器（提供互斥保护）
    vTaskSuspendAll();
    {
        pvReturn = malloc(xWantedSize);
    }
    xTaskResumeAll();

    return pvReturn;
}

void vPortFree(void *pv) {
    if(pv != NULL) {
        vTaskSuspendAll();
        {
            free(pv);
        }
        xTaskResumeAll();
    }
}

配置¶

// FreeRTOSConfig.h
// heap_3使用编译器的堆，不需要configTOTAL_HEAP_SIZE
// 堆大小在链接脚本中配置

// 链接脚本示例（GCC）
_Min_Heap_Size = 0x4000;  /* 16KB堆空间 */
_Min_Stack_Size = 0x1000; /* 4KB栈空间 */

优点： - 实现简单 - 可以使用编译器优化的malloc - 支持内存释放和合并

缺点： - 分配时间不确定 - 依赖编译器实现 - 可能不适合实时系统 - 需要配置链接脚本

使用场景： - 对实时性要求不高的应用 - 需要使用标准库的场景 - 移植现有代码

方案4：heap_4（推荐方案）¶

特点¶

支持释放：可以释放内存
合并相邻块：自动合并相邻的空闲块
减少碎片：有效减少内存碎片
推荐使用：最常用的方案

工作原理¶

初始状态：
┌────────────────────────────────┐
│     空闲块 (20KB)              │
└────────────────────────────────┘

分配A(100B), B(200B), C(150B)：
┌───┬───┬───┬────────────────────┐
│ A │ B │ C │   空闲 (19.55KB)   │
└───┴───┴───┴────────────────────┘

释放B：
┌───┬───┬───┬────────────────────┐
│ A │空 │ C │   空闲 (19.55KB)   │
└───┴───┴───┴────────────────────┘

释放C（自动合并）：
┌───┬────────────────────────────┐
│ A │   空闲 (19.75KB)           │
└───┴────────────────────────────┘
    ↑
    200B + 150B = 350B空闲块（已合并）

数据结构¶

// 块链表节点
typedef struct A_BLOCK_LINK {
    struct A_BLOCK_LINK *pxNextFreeBlock;  // 下一个空闲块
    size_t xBlockSize;                      // 块大小（包含头部）
} BlockLink_t;

// 全局变量
static uint8_t ucHeap[configTOTAL_HEAP_SIZE];  // 堆空间
static BlockLink_t xStart;  // 链表头（哨兵节点）
static BlockLink_t *pxEnd = NULL;  // 链表尾
static size_t xFreeBytesRemaining = 0;  // 剩余空闲字节
static size_t xMinimumEverFreeBytesRemaining = 0;  // 历史最小空闲

初始化¶

static void prvHeapInit(void) {
    BlockLink_t *pxFirstFreeBlock;
    uint8_t *pucAlignedHeap;
    size_t uxAddress;
    size_t xTotalHeapSize = configTOTAL_HEAP_SIZE;

    // 对齐堆起始地址
    uxAddress = (size_t)ucHeap;
    if((uxAddress & portBYTE_ALIGNMENT_MASK) != 0) {
        uxAddress += (portBYTE_ALIGNMENT - 
                     (uxAddress & portBYTE_ALIGNMENT_MASK));
        xTotalHeapSize -= uxAddress - (size_t)ucHeap;
    }
    pucAlignedHeap = (uint8_t *)uxAddress;

    // 初始化链表头
    xStart.pxNextFreeBlock = (void *)pucAlignedHeap;
    xStart.xBlockSize = 0;

    // 创建第一个空闲块
    pxFirstFreeBlock = (void *)pucAlignedHeap;
    pxFirstFreeBlock->xBlockSize = xTotalHeapSize;
    pxFirstFreeBlock->pxNextFreeBlock = pxEnd;

    // 初始化统计信息
    xFreeBytesRemaining = xTotalHeapSize;
    xMinimumEverFreeBytesRemaining = xTotalHeapSize;
}

分配算法¶

void *pvPortMalloc(size_t xWantedSize) {
    BlockLink_t *pxBlock, *pxPreviousBlock, *pxNewBlockLink;
    void *pvReturn = NULL;

    vTaskSuspendAll();
    {
        // 首次调用时初始化
        if(pxEnd == NULL) {
            prvHeapInit();
        }

        // 调整大小（包含块头和对齐）
        if(xWantedSize > 0) {
            xWantedSize += xHeapStructSize;
            if((xWantedSize & portBYTE_ALIGNMENT_MASK) != 0x00) {
                xWantedSize += (portBYTE_ALIGNMENT - 
                               (xWantedSize & portBYTE_ALIGNMENT_MASK));
            }
        }

        // 检查大小是否合理
        if((xWantedSize > 0) && (xWantedSize <= xFreeBytesRemaining)) {
            // 遍历空闲链表，找到第一个足够大的块
            pxPreviousBlock = &xStart;
            pxBlock = xStart.pxNextFreeBlock;

            while((pxBlock->xBlockSize < xWantedSize) && 
                  (pxBlock->pxNextFreeBlock != NULL)) {
                pxPreviousBlock = pxBlock;
                pxBlock = pxBlock->pxNextFreeBlock;
            }

            if(pxBlock != pxEnd) {
                // 找到合适的块
                pvReturn = (void *)(((uint8_t *)pxPreviousBlock->pxNextFreeBlock) 
                                   + xHeapStructSize);

                // 从空闲链表中移除
                pxPreviousBlock->pxNextFreeBlock = pxBlock->pxNextFreeBlock;

                // 如果剩余空间足够大，分割块
                if((pxBlock->xBlockSize - xWantedSize) > heapMINIMUM_BLOCK_SIZE) {
                    pxNewBlockLink = (void *)(((uint8_t *)pxBlock) + xWantedSize);
                    pxNewBlockLink->xBlockSize = pxBlock->xBlockSize - xWantedSize;
                    pxBlock->xBlockSize = xWantedSize;

                    // 插入新块到空闲链表
                    prvInsertBlockIntoFreeList(pxNewBlockLink);
                }

                xFreeBytesRemaining -= pxBlock->xBlockSize;

                if(xFreeBytesRemaining < xMinimumEverFreeBytesRemaining) {
                    xMinimumEverFreeBytesRemaining = xFreeBytesRemaining;
                }

                // 标记块为已分配
                pxBlock->xBlockSize |= xBlockAllocatedBit;
                pxBlock->pxNextFreeBlock = NULL;
            }
        }
    }
    xTaskResumeAll();

    return pvReturn;
}

释放算法（关键：合并相邻块）¶

void vPortFree(void *pv) {
    uint8_t *puc = (uint8_t *)pv;
    BlockLink_t *pxLink;

    if(pv != NULL) {
        // 获取块头
        puc -= xHeapStructSize;
        pxLink = (void *)puc;

        // 检查块是否已分配
        configASSERT((pxLink->xBlockSize & xBlockAllocatedBit) != 0);
        configASSERT(pxLink->pxNextFreeBlock == NULL);

        if((pxLink->xBlockSize & xBlockAllocatedBit) != 0) {
            if(pxLink->pxNextFreeBlock == NULL) {
                // 清除分配标志
                pxLink->xBlockSize &= ~xBlockAllocatedBit;

                vTaskSuspendAll();
                {
                    // 更新空闲字节数
                    xFreeBytesRemaining += pxLink->xBlockSize;

                    // 插入到空闲链表（会自动合并相邻块）
                    prvInsertBlockIntoFreeList(((BlockLink_t *)pxLink));
                }
                xTaskResumeAll();
            }
        }
    }
}

合并相邻块¶

static void prvInsertBlockIntoFreeList(BlockLink_t *pxBlockToInsert) {
    BlockLink_t *pxIterator;
    uint8_t *puc;

    // 按地址顺序插入
    for(pxIterator = &xStart; 
        pxIterator->pxNextFreeBlock < pxBlockToInsert; 
        pxIterator = pxIterator->pxNextFreeBlock) {
        // 空循环体
    }

    // 检查是否可以与后面的块合并
    puc = (uint8_t *)pxIterator;
    if((puc + pxIterator->xBlockSize) == (uint8_t *)pxBlockToInsert) {
        // 可以合并
        pxIterator->xBlockSize += pxBlockToInsert->xBlockSize;
        pxBlockToInsert = pxIterator;
    }

    // 检查是否可以与前面的块合并
    puc = (uint8_t *)pxBlockToInsert;
    if((puc + pxBlockToInsert->xBlockSize) == 
       (uint8_t *)pxIterator->pxNextFreeBlock) {
        if(pxIterator->pxNextFreeBlock != pxEnd) {
            // 可以合并
            pxBlockToInsert->xBlockSize += 
                pxIterator->pxNextFreeBlock->xBlockSize;
            pxBlockToInsert->pxNextFreeBlock = 
                pxIterator->pxNextFreeBlock->pxNextFreeBlock;
        } else {
            pxBlockToInsert->pxNextFreeBlock = pxEnd;
        }
    } else {
        pxBlockToInsert->pxNextFreeBlock = pxIterator->pxNextFreeBlock;
    }

    // 如果没有与前面的块合并，更新链接
    if(pxIterator != pxBlockToInsert) {
        pxIterator->pxNextFreeBlock = pxBlockToInsert;
    }
}

使用示例¶

#include "FreeRTOS.h"
#include "task.h"

void Dynamic_Task(void *param) {
    void *buffer1, *buffer2, *buffer3;

    while(1) {
        // 分配内存
        buffer1 = pvPortMalloc(100);
        buffer2 = pvPortMalloc(200);
        buffer3 = pvPortMalloc(150);

        if(buffer1 && buffer2 && buffer3) {
            printf("Allocated: %p, %p, %p\n", buffer1, buffer2, buffer3);

            // 使用内存
            memset(buffer1, 0, 100);
            memset(buffer2, 0, 200);
            memset(buffer3, 0, 150);

            // 释放内存（会自动合并相邻块）
            vPortFree(buffer2);  // 先释放中间的
            vPortFree(buffer1);  // 再释放前面的（会合并）
            vPortFree(buffer3);  // 最后释放后面的（会合并）

            printf("Free bytes: %d\n", xPortGetFreeHeapSize());
        } else {
            printf("Allocation failed!\n");
        }

        vTaskDelay(pdMS_TO_TICKS(1000));
    }
}

int main(void) {
    SystemInit();

    // 创建任务
    xTaskCreate(Dynamic_Task, "Dynamic", 256, NULL, 1, NULL);

    // 启动调度器
    vTaskStartScheduler();

    while(1);
}

优点： - 支持内存释放 - 自动合并相邻空闲块 - 有效减少碎片 - 适合大多数应用

缺点： - 分配时间不完全确定（取决于空闲链表长度） - 比heap_1复杂 - 需要更多的管理开销

方案5：heap_5（支持多个不连续内存区域）¶

特点¶

多内存区域：支持多个不连续的内存区域
灵活配置：可以使用内部RAM、外部RAM等
基于heap_4：合并相邻块的功能
需要初始化：必须先调用vPortDefineHeapRegions()

工作原理¶

内存布局：
┌─────────────────┐ 0x20000000
│  内部RAM (64KB) │
│  ┌───────────┐  │
│  │ 堆区域1   │  │ ← 可用于堆
│  └───────────┘  │
└─────────────────┘

┌─────────────────┐ 0x60000000
│  外部RAM (1MB)  │
│  ┌───────────┐  │
│  │ 堆区域2   │  │ ← 可用于堆
│  └───────────┘  │
└─────────────────┘

┌─────────────────┐ 0x68000000
│  CCM RAM (64KB) │
│  ┌───────────┐  │
│  │ 堆区域3   │  │ ← 可用于堆
│  └───────────┘  │
└─────────────────┘

配置和初始化¶

#include "FreeRTOS.h"
#include "task.h"

// 定义内存区域
const HeapRegion_t xHeapRegions[] = {
    // 内部RAM：64KB，起始地址0x20000000
    { (uint8_t *)0x20000000UL, 0x10000 },  // 64KB

    // 外部SDRAM：1MB，起始地址0x60000000
    { (uint8_t *)0x60000000UL, 0x100000 }, // 1MB

    // CCM RAM：64KB，起始地址0x10000000
    { (uint8_t *)0x10000000UL, 0x10000 },  // 64KB

    // 结束标记
    { NULL, 0 }
};

int main(void) {
    // 系统初始化
    SystemInit();

    // 初始化堆（必须在创建任何RTOS对象之前调用）
    vPortDefineHeapRegions(xHeapRegions);

    // 现在可以创建任务和其他对象
    xTaskCreate(Task1, "Task1", 256, NULL, 1, NULL);
    xTaskCreate(Task2, "Task2", 256, NULL, 1, NULL);

    // 启动调度器
    vTaskStartScheduler();

    while(1);
}

实际应用示例¶

// STM32F407示例：使用内部RAM和CCM RAM
const HeapRegion_t xHeapRegions[] = {
    // 内部SRAM1：112KB (0x20000000 - 0x2001BFFF)
    // 保留前16KB给全局变量和栈，剩余96KB用于堆
    { (uint8_t *)0x20004000UL, 96 * 1024 },

    // CCM RAM：64KB (0x10000000 - 0x1000FFFF)
    // 全部用于堆（CCM不能用于DMA）
    { (uint8_t *)0x10000000UL, 64 * 1024 },

    { NULL, 0 }
};

// STM32H7示例：使用多个RAM区域
const HeapRegion_t xHeapRegions[] = {
    // DTCM RAM：128KB (0x20000000)
    { (uint8_t *)0x20000000UL, 128 * 1024 },

    // AXI SRAM：512KB (0x24000000)
    { (uint8_t *)0x24000000UL, 512 * 1024 },

    // SRAM1：128KB (0x30000000)
    { (uint8_t *)0x30000000UL, 128 * 1024 },

    // SRAM2：128KB (0x30020000)
    { (uint8_t *)0x30020000UL, 128 * 1024 },

    { NULL, 0 }
};

注意事项¶

// ❌ 错误：在初始化堆之前创建对象
int main(void) {
    SystemInit();

    // 错误：此时堆还未初始化
    xTaskCreate(Task1, "Task1", 256, NULL, 1, NULL);

    // 初始化堆（太晚了）
    vPortDefineHeapRegions(xHeapRegions);

    vTaskStartScheduler();
    while(1);
}

// ✅ 正确：先初始化堆，再创建对象
int main(void) {
    SystemInit();

    // 首先初始化堆
    vPortDefineHeapRegions(xHeapRegions);

    // 然后创建对象
    xTaskCreate(Task1, "Task1", 256, NULL, 1, NULL);

    vTaskStartScheduler();
    while(1);
}

优点： - 支持多个不连续内存区域 - 可以充分利用所有可用RAM - 基于heap_4，支持合并相邻块 - 灵活性高

缺点： - 配置复杂 - 需要了解硬件内存布局 - 必须在创建对象前初始化 - 某些RAM区域可能有限制（如CCM不支持DMA）

内存池设计¶

内存池是一种预分配固定大小内存块的管理方式，适合频繁分配/释放相同大小对象的场景。

内存池原理¶

内存池结构：
┌─────────────────────────────────────┐
│  内存池控制块                        │
│  - 块大小                            │
│  - 块数量                            │
│  - 空闲链表头                        │
└─────────────────────────────────────┘
         ↓
┌───┬───┬───┬───┬───┬───┬───┬───┬───┐
│ 0 │ 1 │ 2 │ 3 │ 4 │ 5 │ 6 │ 7 │ 8 │  内存块
└───┴───┴───┴───┴───┴───┴───┴───┴───┘
  ↓   ↓   ↓   ↓   ↓   ↓   ↓   ↓   ↓
 空闲链表（初始时所有块都在链表中）

简单内存池实现¶

#include <stdint.h>
#include <stddef.h>
#include <string.h>

// 内存池控制块
typedef struct {
    void *pool_start;        // 内存池起始地址
    void *free_list;         // 空闲链表头
    size_t block_size;       // 块大小
    size_t block_count;      // 块数量
    size_t free_count;       // 空闲块数量
} MemoryPool_t;

// 初始化内存池
void MemPool_Init(MemoryPool_t *pool, void *memory, 
                  size_t block_size, size_t block_count) {
    uint8_t *ptr = (uint8_t *)memory;

    pool->pool_start = memory;
    pool->block_size = block_size;
    pool->block_count = block_count;
    pool->free_count = block_count;

    // 构建空闲链表
    pool->free_list = memory;
    for(size_t i = 0; i < block_count - 1; i++) {
        *(void **)ptr = ptr + block_size;
        ptr += block_size;
    }
    *(void **)ptr = NULL;  // 最后一个块指向NULL
}

// 分配内存块
void *MemPool_Alloc(MemoryPool_t *pool) {
    void *block = NULL;

    if(pool->free_list != NULL) {
        // 从空闲链表头取出一个块
        block = pool->free_list;
        pool->free_list = *(void **)block;
        pool->free_count--;
    }

    return block;
}

// 释放内存块
void MemPool_Free(MemoryPool_t *pool, void *block) {
    if(block != NULL) {
        // 将块插入空闲链表头
        *(void **)block = pool->free_list;
        pool->free_list = block;
        pool->free_count++;
    }
}

// 获取空闲块数量
size_t MemPool_GetFreeCount(MemoryPool_t *pool) {
    return pool->free_count;
}

线程安全的内存池¶

#include "FreeRTOS.h"
#include "semphr.h"

// 线程安全的内存池
typedef struct {
    void *pool_start;
    void *free_list;
    size_t block_size;
    size_t block_count;
    size_t free_count;
    SemaphoreHandle_t mutex;  // 互斥量
} ThreadSafeMemPool_t;

// 初始化线程安全内存池
BaseType_t MemPool_InitSafe(ThreadSafeMemPool_t *pool, void *memory,
                             size_t block_size, size_t block_count) {
    uint8_t *ptr = (uint8_t *)memory;

    // 创建互斥量
    pool->mutex = xSemaphoreCreateMutex();
    if(pool->mutex == NULL) {
        return pdFAIL;
    }

    pool->pool_start = memory;
    pool->block_size = block_size;
    pool->block_count = block_count;
    pool->free_count = block_count;

    // 构建空闲链表
    pool->free_list = memory;
    for(size_t i = 0; i < block_count - 1; i++) {
        *(void **)ptr = ptr + block_size;
        ptr += block_size;
    }
    *(void **)ptr = NULL;

    return pdPASS;
}

// 线程安全分配
void *MemPool_AllocSafe(ThreadSafeMemPool_t *pool, TickType_t timeout) {
    void *block = NULL;

    if(xSemaphoreTake(pool->mutex, timeout) == pdTRUE) {
        if(pool->free_list != NULL) {
            block = pool->free_list;
            pool->free_list = *(void **)block;
            pool->free_count--;
        }
        xSemaphoreGive(pool->mutex);
    }

    return block;
}

// 线程安全释放
void MemPool_FreeSafe(ThreadSafeMemPool_t *pool, void *block) {
    if(block != NULL) {
        if(xSemaphoreTake(pool->mutex, portMAX_DELAY) == pdTRUE) {
            *(void **)block = pool->free_list;
            pool->free_list = block;
            pool->free_count++;
            xSemaphoreGive(pool->mutex);
        }
    }
}

内存池应用示例¶

#include "FreeRTOS.h"
#include "task.h"

// 消息结构
typedef struct {
    uint32_t msg_id;
    uint32_t timestamp;
    uint8_t data[64];
} Message_t;

// 内存池
static uint8_t message_pool_memory[10 * sizeof(Message_t)];
static ThreadSafeMemPool_t message_pool;

// 生产者任务
void Producer_Task(void *param) {
    Message_t *msg;
    uint32_t counter = 0;

    while(1) {
        // 从内存池分配消息
        msg = (Message_t *)MemPool_AllocSafe(&message_pool, 
                                             pdMS_TO_TICKS(100));

        if(msg != NULL) {
            // 填充消息
            msg->msg_id = counter++;
            msg->timestamp = xTaskGetTickCount();
            snprintf((char *)msg->data, sizeof(msg->data), 
                    "Message %d", msg->msg_id);

            printf("Produced: ID=%d\n", msg->msg_id);

            // 发送到队列（这里简化处理，直接释放）
            // 实际应用中会发送到队列供消费者处理

            // 模拟处理
            vTaskDelay(pdMS_TO_TICKS(50));

            // 释放回内存池
            MemPool_FreeSafe(&message_pool, msg);
        } else {
            printf("Pool full, waiting...\n");
        }

        vTaskDelay(pdMS_TO_TICKS(100));
    }
}

int main(void) {
    SystemInit();

    // 初始化内存池
    if(MemPool_InitSafe(&message_pool, message_pool_memory,
                        sizeof(Message_t), 10) == pdPASS) {
        printf("Memory pool initialized: %d blocks\n", 10);

        // 创建任务
        xTaskCreate(Producer_Task, "Producer", 256, NULL, 2, NULL);

        // 启动调度器
        vTaskStartScheduler();
    }

    while(1);
}

内存池优势¶

性能优势：

// 对比测试
void Performance_Test(void) {
    uint32_t start, end;
    void *ptr;

    // 测试pvPortMalloc
    start = xTaskGetTickCount();
    for(int i = 0; i < 1000; i++) {
        ptr = pvPortMalloc(64);
        vPortFree(ptr);
    }
    end = xTaskGetTickCount();
    printf("pvPortMalloc: %d ms\n", end - start);

    // 测试内存池
    start = xTaskGetTickCount();
    for(int i = 0; i < 1000; i++) {
        ptr = MemPool_AllocSafe(&message_pool, 0);
        MemPool_FreeSafe(&message_pool, ptr);
    }
    end = xTaskGetTickCount();
    printf("MemPool: %d ms\n", end - start);
}

// 典型结果：
// pvPortMalloc: 45 ms
// MemPool: 8 ms
// 内存池快约5-6倍

内存池适用场景： - 频繁分配/释放相同大小的对象 - 对分配时间有严格要求 - 需要避免内存碎片 - 对象生命周期短

内存池不适用场景： - 对象大小变化大 - 分配频率低 - 对象生命周期长 - 内存资源紧张

内存碎片问题¶

什么是内存碎片？¶

**内存碎片**是指内存中存在许多小的、不连续的空闲块，虽然总空闲空间足够，但无法分配大的连续空间。

示例：
初始：[████████████████████████] 24KB连续

分配A(4KB), B(4KB), C(4KB), D(4KB), E(4KB), F(4KB)：
[A][B][C][D][E][F]

释放B, D, F：
[A][ ][C][ ][E][ ]
    ↑    ↑    ↑
   4KB  4KB  4KB  总共12KB空闲

问题：无法分配8KB连续空间，虽然总空闲有12KB

碎片产生的原因¶

分配和释放顺序不匹配

// 分配顺序：A → B → C
void *a = pvPortMalloc(100);
void *b = pvPortMalloc(200);
void *c = pvPortMalloc(150);

// 释放顺序：B → A → C（中间先释放）
vPortFree(b);  // 产生碎片
vPortFree(a);
vPortFree(c);

分配大小不一致

// 大小变化大的分配
void *p1 = pvPortMalloc(50);
void *p2 = pvPortMalloc(500);
void *p3 = pvPortMalloc(100);
void *p4 = pvPortMalloc(300);

// 释放后产生不同大小的碎片
vPortFree(p2);  // 500字节碎片
vPortFree(p4);  // 300字节碎片

长期运行累积

// 系统长期运行，反复分配释放
while(1) {
    void *temp = pvPortMalloc(random_size());
    // 使用...
    vPortFree(temp);
    // 碎片逐渐累积
}

减少碎片的策略¶

策略1：使用heap_4或heap_5¶

// heap_4会自动合并相邻空闲块
void *a = pvPortMalloc(100);
void *b = pvPortMalloc(200);
void *c = pvPortMalloc(150);

vPortFree(b);  // 释放中间块
vPortFree(c);  // 自动与b合并成350字节块
vPortFree(a);  // 自动与bc合并成450字节块

策略2：使用内存池¶

// 对于固定大小的对象，使用内存池
typedef struct {
    uint32_t id;
    uint8_t data[64];
} Packet_t;

// 创建内存池
static uint8_t packet_pool[20 * sizeof(Packet_t)];
static MemoryPool_t pool;

// 初始化
MemPool_Init(&pool, packet_pool, sizeof(Packet_t), 20);

// 使用内存池（不会产生碎片）
Packet_t *pkt = (Packet_t *)MemPool_Alloc(&pool);
// 使用...
MemPool_Free(&pool, pkt);

策略3：预分配策略¶

// 在系统启动时预分配所有需要的对象
int main(void) {
    SystemInit();

    // 预分配所有任务
    xTaskCreate(Task1, "Task1", 256, NULL, 1, NULL);
    xTaskCreate(Task2, "Task2", 256, NULL, 1, NULL);
    xTaskCreate(Task3, "Task3", 256, NULL, 1, NULL);

    // 预分配所有队列
    queue1 = xQueueCreate(10, sizeof(uint32_t));
    queue2 = xQueueCreate(20, sizeof(uint8_t));

    // 预分配所有信号量
    sem1 = xSemaphoreCreateBinary();
    sem2 = xSemaphoreCreateMutex();

    // 启动后不再动态分配
    vTaskStartScheduler();

    while(1);
}

策略4：使用静态分配¶

// 使用静态分配避免碎片
static StackType_t task1_stack[256];
static StaticTask_t task1_tcb;

TaskHandle_t task1 = xTaskCreateStatic(
    Task1_Function,
    "Task1",
    256,
    NULL,
    1,
    task1_stack,
    &task1_tcb
);

策略5：分配大小对齐¶

// 将分配大小对齐到2的幂次
size_t AlignSize(size_t size) {
    // 对齐到8, 16, 32, 64, 128, 256...
    if(size <= 8) return 8;
    if(size <= 16) return 16;
    if(size <= 32) return 32;
    if(size <= 64) return 64;
    if(size <= 128) return 128;
    if(size <= 256) return 256;
    // ...
    return size;
}

// 使用对齐后的大小分配
void *ptr = pvPortMalloc(AlignSize(actual_size));

监控内存碎片¶

#include "FreeRTOS.h"
#include "task.h"

// 内存统计信息
typedef struct {
    size_t total_heap;           // 总堆大小
    size_t free_heap;            // 当前空闲
    size_t min_free_heap;        // 历史最小空闲
    size_t largest_free_block;   // 最大连续空闲块
    size_t fragmentation;        // 碎片率(%)
} MemoryStats_t;

// 获取内存统计
void GetMemoryStats(MemoryStats_t *stats) {
    stats->total_heap = configTOTAL_HEAP_SIZE;
    stats->free_heap = xPortGetFreeHeapSize();
    stats->min_free_heap = xPortGetMinimumEverFreeHeapSize();

    // 获取最大连续空闲块（需要遍历空闲链表）
    stats->largest_free_block = GetLargestFreeBlock();

    // 计算碎片率
    if(stats->free_heap > 0) {
        stats->fragmentation = 
            ((stats->free_heap - stats->largest_free_block) * 100) / 
            stats->free_heap;
    } else {
        stats->fragmentation = 0;
    }
}

// 监控任务
void Memory_Monitor_Task(void *param) {
    MemoryStats_t stats;

    while(1) {
        GetMemoryStats(&stats);

        printf("=== Memory Statistics ===\n");
        printf("Total Heap: %d bytes\n", stats.total_heap);
        printf("Free Heap: %d bytes\n", stats.free_heap);
        printf("Min Free: %d bytes\n", stats.min_free_heap);
        printf("Largest Block: %d bytes\n", stats.largest_free_block);
        printf("Fragmentation: %d%%\n", stats.fragmentation);

        // 警告：碎片率过高
        if(stats.fragmentation > 50) {
            printf("WARNING: High fragmentation!\n");
        }

        // 警告：可用内存过低
        if(stats.free_heap < 1024) {
            printf("WARNING: Low memory!\n");
        }

        vTaskDelay(pdMS_TO_TICKS(5000));  // 每5秒检查一次
    }
}

性能对比与选择¶

各方案性能对比¶

方案	分配速度	释放支持	碎片处理	内存效率	确定性	复杂度
heap_1	极快	❌	无碎片	高	极好	极低
heap_2	快	✅	不合并	中	好	低
heap_3	慢	✅	依赖编译器	中	差	低
heap_4	中	✅	自动合并	高	较好	中
heap_5	中	✅	自动合并	极高	较好	高
内存池	极快	✅	无碎片	中	极好	中

选择建议¶

场景1：静态系统（推荐heap_1）¶

// 特点：
// - 所有对象在启动时创建
// - 运行期间不创建/删除对象
// - 对实时性要求高

// 配置
#define configSUPPORT_DYNAMIC_ALLOCATION  1
// 使用heap_1.c

// 示例
int main(void) {
    SystemInit();

    // 启动时创建所有对象
    xTaskCreate(Task1, "Task1", 256, NULL, 1, NULL);
    xTaskCreate(Task2, "Task2", 256, NULL, 1, NULL);
    queue = xQueueCreate(10, sizeof(uint32_t));

    // 启动后不再分配
    vTaskStartScheduler();
    while(1);
}

场景2：动态系统（推荐heap_4）¶

// 特点：
// - 需要动态创建/删除对象
// - 对实时性有一定要求
// - 需要避免碎片

// 配置
#define configSUPPORT_DYNAMIC_ALLOCATION  1
#define configTOTAL_HEAP_SIZE  (20 * 1024)
// 使用heap_4.c

// 示例
void Dynamic_System(void) {
    // 动态创建任务
    TaskHandle_t temp_task;
    xTaskCreate(TempTask, "Temp", 256, NULL, 1, &temp_task);

    // 任务完成后删除
    vTaskDelete(temp_task);

    // 内存会自动合并，减少碎片
}

场景3：多内存区域（推荐heap_5）¶

// 特点：
// - 有多个不连续的RAM区域
// - 需要充分利用所有RAM
// - 如STM32H7、STM32F7等

// 配置
const HeapRegion_t xHeapRegions[] = {
    { (uint8_t *)0x20000000UL, 64 * 1024 },   // 内部RAM
    { (uint8_t *)0x60000000UL, 1024 * 1024 }, // 外部SDRAM
    { NULL, 0 }
};

int main(void) {
    SystemInit();
    vPortDefineHeapRegions(xHeapRegions);
    // ...
}

场景4：固定大小对象（推荐内存池）¶

// 特点：
// - 频繁分配/释放相同大小对象
// - 对分配速度要求极高
// - 如网络数据包、消息队列

// 示例
typedef struct {
    uint32_t id;
    uint8_t data[128];
} Packet_t;

static uint8_t packet_pool[50 * sizeof(Packet_t)];
static MemoryPool_t pool;

void Init(void) {
    MemPool_Init(&pool, packet_pool, sizeof(Packet_t), 50);
}

void Process(void) {
    Packet_t *pkt = (Packet_t *)MemPool_Alloc(&pool);
    // 使用...
    MemPool_Free(&pool, pkt);
}

内存优化技巧¶

技巧1：减少任务栈大小¶

// ❌ 过大的栈（浪费内存）
xTaskCreate(Task1, "Task1", 1024, NULL, 1, NULL);  // 1KB栈

// ✅ 合理的栈大小
xTaskCreate(Task1, "Task1", 256, NULL, 1, NULL);   // 256B栈

// 如何确定合适的栈大小？
void Task1(void *param) {
    while(1) {
        // 检查栈使用情况
        UBaseType_t stack_high_water = uxTaskGetStackHighWaterMark(NULL);
        printf("Stack remaining: %d words\n", stack_high_water);

        // 如果stack_high_water很大，说明栈分配过多
        // 如果stack_high_water很小(<50)，说明栈可能不够

        vTaskDelay(pdMS_TO_TICKS(1000));
    }
}

技巧2：使用静态分配¶

// 动态分配（使用堆）
TaskHandle_t task1;
xTaskCreate(Task1, "Task1", 256, NULL, 1, &task1);

// 静态分配（不使用堆）
static StackType_t task1_stack[256];
static StaticTask_t task1_tcb;
TaskHandle_t task1 = xTaskCreateStatic(
    Task1, "Task1", 256, NULL, 1,
    task1_stack, &task1_tcb
);

// 优势：
// - 不占用堆空间
// - 编译时确定，不会失败
// - 适合内存紧张的系统

技巧3：共享缓冲区¶

// ❌ 每个任务都有自己的缓冲区
void Task1(void *param) {
    uint8_t buffer1[1024];  // 1KB
    // ...
}

void Task2(void *param) {
    uint8_t buffer2[1024];  // 1KB
    // ...
}
// 总共2KB

// ✅ 共享缓冲区（如果任务不会同时使用）
static uint8_t shared_buffer[1024];  // 1KB
static SemaphoreHandle_t buffer_mutex;

void Task1(void *param) {
    while(1) {
        xSemaphoreTake(buffer_mutex, portMAX_DELAY);
        // 使用shared_buffer
        xSemaphoreGive(buffer_mutex);
        vTaskDelay(pdMS_TO_TICKS(100));
    }
}

void Task2(void *param) {
    while(1) {
        xSemaphoreTake(buffer_mutex, portMAX_DELAY);
        // 使用shared_buffer
        xSemaphoreGive(buffer_mutex);
        vTaskDelay(pdMS_TO_TICKS(100));
    }
}
// 总共1KB

技巧4：延迟分配¶

// ❌ 启动时分配所有内存
void Init(void) {
    buffer1 = pvPortMalloc(1024);  // 可能不会立即使用
    buffer2 = pvPortMalloc(2048);
    buffer3 = pvPortMalloc(512);
}

// ✅ 需要时才分配
void *buffer1 = NULL;

void UseBuffer(void) {
    if(buffer1 == NULL) {
        buffer1 = pvPortMalloc(1024);  // 首次使用时分配
    }
    // 使用buffer1
}

技巧5：及时释放¶

// ❌ 长期持有不使用的内存
void Task(void *param) {
    void *large_buffer = pvPortMalloc(4096);

    // 使用buffer
    ProcessData(large_buffer);

    // 之后不再使用，但没有释放
    while(1) {
        // 做其他事情
        vTaskDelay(pdMS_TO_TICKS(1000));
    }
    // large_buffer一直占用内存
}

// ✅ 及时释放不使用的内存
void Task(void *param) {
    while(1) {
        void *large_buffer = pvPortMalloc(4096);

        if(large_buffer != NULL) {
            // 使用buffer
            ProcessData(large_buffer);

            // 使用完立即释放
            vPortFree(large_buffer);
        }

        vTaskDelay(pdMS_TO_TICKS(1000));
    }
}

常见问题¶

Q1: 如何选择合适的堆大小？¶

A: 堆大小的选择需要考虑多个因素：

计算方法：

// 堆大小 = 动态对象总和 + 20%缓冲

// 示例计算：
// 3个任务，每个256B栈：3 × 256 = 768B
// 2个队列，每个10×4B：2 × 40 = 80B
// 5个信号量，每个约100B：5 × 100 = 500B
// 其他对象：约200B
// 总计：768 + 80 + 500 + 200 = 1548B
// 加20%缓冲：1548 × 1.2 ≈ 1856B
// 建议配置：2KB (2048B)

#define configTOTAL_HEAP_SIZE  (2 * 1024)

动态测试：

void Monitor_Task(void *param) {
    while(1) {
        size_t free_heap = xPortGetFreeHeapSize();
        size_t min_free = xPortGetMinimumEverFreeHeapSize();

        printf("Free: %d, Min: %d\n", free_heap, min_free);

        // 如果min_free太小(<512B)，需要增加堆大小
        // 如果min_free很大(>50%总堆)，可以减小堆大小

        vTaskDelay(pdMS_TO_TICKS(5000));
    }
}

Q2: 内存分配失败怎么办？¶

A: 处理内存分配失败的策略：

方法1：检查返回值

void *buffer = pvPortMalloc(1024);
if(buffer == NULL) {
    // 分配失败，采取措施
    printf("Memory allocation failed!\n");

    // 选项1：使用备用方案
    UseStaticBuffer();

    // 选项2：释放一些内存后重试
    FreeUnusedMemory();
    buffer = pvPortMalloc(1024);

    // 选项3：降级服务
    UseSmallerBuffer();
}

方法2：使用分配失败钩子

// FreeRTOSConfig.h
#define configUSE_MALLOC_FAILED_HOOK  1

// 实现钩子函数
void vApplicationMallocFailedHook(void) {
    // 分配失败时自动调用
    printf("FATAL: Memory allocation failed!\n");

    // 记录错误信息
    LogError("Out of memory");

    // 尝试恢复
    FreeUnusedMemory();

    // 或者重启系统
    // NVIC_SystemReset();
}

方法3：预留紧急内存

// 预留紧急内存
static uint8_t emergency_buffer[1024];
static bool emergency_in_use = false;

void *SafeMalloc(size_t size) {
    void *ptr = pvPortMalloc(size);

    if(ptr == NULL && size <= sizeof(emergency_buffer) && !emergency_in_use) {
        // 使用紧急内存
        emergency_in_use = true;
        ptr = emergency_buffer;
        printf("Using emergency buffer\n");
    }

    return ptr;
}

Q3: 如何检测内存泄漏？¶

A: 检测内存泄漏的方法：

方法1：监控空闲内存

void Leak_Detection_Task(void *param) {
    size_t last_free = xPortGetFreeHeapSize();

    while(1) {
        vTaskDelay(pdMS_TO_TICKS(10000));  // 每10秒检查

        size_t current_free = xPortGetFreeHeapSize();

        if(current_free < last_free) {
            printf("WARNING: Memory decreased by %d bytes\n", 
                   last_free - current_free);

            // 如果持续减少，可能有内存泄漏
        }

        last_free = current_free;
    }
}

方法2：记录分配和释放

// 包装malloc/free，记录调用
static uint32_t alloc_count = 0;
static uint32_t free_count = 0;

void *TrackedMalloc(size_t size) {
    void *ptr = pvPortMalloc(size);
    if(ptr != NULL) {
        alloc_count++;
        printf("Alloc #%d: %p (%d bytes)\n", alloc_count, ptr, size);
    }
    return ptr;
}

void TrackedFree(void *ptr) {
    if(ptr != NULL) {
        free_count++;
        printf("Free #%d: %p\n", free_count, ptr);
        vPortFree(ptr);
    }
}

// 检查是否平衡
void CheckBalance(void) {
    printf("Allocs: %d, Frees: %d, Diff: %d\n", 
           alloc_count, free_count, alloc_count - free_count);

    // 如果差值持续增大，可能有泄漏
}

Q4: heap_4和heap_5有什么区别？¶

A: 主要区别在于内存区域的支持：

heap_4： - 单一连续内存区域 - 自动使用ucHeap数组 - 配置简单 - 适合大多数应用

// heap_4配置
#define configTOTAL_HEAP_SIZE  (20 * 1024)
// 自动使用内部定义的ucHeap数组

heap_5： - 支持多个不连续内存区域 - 需要手动定义内存区域 - 配置复杂 - 适合多RAM区域的MCU

// heap_5配置
const HeapRegion_t xHeapRegions[] = {
    { (uint8_t *)0x20000000UL, 64 * 1024 },   // 区域1
    { (uint8_t *)0x60000000UL, 1024 * 1024 }, // 区域2
    { NULL, 0 }
};

// 必须在创建对象前初始化
vPortDefineHeapRegions(xHeapRegions);

选择建议： - 单一RAM区域 → heap_4 - 多个RAM区域 → heap_5 - 需要使用外部RAM → heap_5

Q5: 如何避免堆栈溢出？¶

A: 预防堆栈溢出的方法：

方法1：启用堆栈溢出检测

// FreeRTOSConfig.h
#define configCHECK_FOR_STACK_OVERFLOW  2  // 启用方法2（更全面）

// 实现钩子函数
void vApplicationStackOverflowHook(TaskHandle_t xTask, char *pcTaskName) {
    printf("FATAL: Stack overflow in task: %s\n", pcTaskName);

    // 记录错误
    LogError("Stack overflow");

    // 可以选择重启
    // NVIC_SystemReset();

    // 或者进入死循环便于调试
    while(1);
}

方法2：监控栈使用

href="#__codelineno-63-1">void Monitor_Stack_Task(void *param) { TaskHandle_t task_handles[10]; UBaseType_t task_count; while(1) { // 获取所有任务 task_count = uxTaskGetNumberOfTasks(); // 检查每个任务的栈使用 for(UBaseType_t i = 0; i < task_count; i++) { TaskHandle_t task = task_handles[i]; UBaseType_t stack_remaining = uxTaskGetStackHighWaterMark(task); const char *task_name = pcTaskGetName(task); printf("Task %s: %d words remaining\n", task_name, stack_remaining); // 警告：栈剩余过少 if(stack_remaining < 50) { printf("WARNING: Low stack in %s\n", task_name); } } vTaskDelay(pdMS_TO_TICKS(5000)); } }

方法3：合理分配栈大小

// 根据任务复杂度分配栈
xTaskCreate(SimpleTask, "Simple", 128, NULL, 1, NULL);    // 简单任务
xTaskCreate(NormalTask, "Normal", 256, NULL, 1, NULL);    // 普通任务
xTaskCreate(ComplexTask, "Complex", 512, NULL, 1, NULL);  // 复杂任务

// 避免在栈上分配大数组
void Task(void *param) {
    // ❌ 错误：在栈上分配大数组
    uint8_t large_buffer[2048];  // 可能导致栈溢出

    // ✅ 正确：使用堆或静态分配
    uint8_t *buffer = pvPortMalloc(2048);
    // 或
    static uint8_t buffer[2048];
}

总结¶

核心要点¶

内存管理方案
heap_1：只分配不释放，适合静态系统
heap_2：支持释放但会产生碎片（已过时）
heap_3：封装标准库malloc/free
heap_4：支持释放和合并，推荐使用
heap_5：支持多内存区域，基于heap_4
内存池
预分配固定大小内存块
分配速度快，不产生碎片
适合频繁分配/释放相同大小对象
内存碎片
产生原因：分配释放顺序不匹配、大小不一致
解决方案：使用heap_⅘、内存池、预分配、静态分配
监控方法：检查空闲内存和最大连续块
优化技巧
减少任务栈大小
使用静态分配
共享缓冲区
延迟分配
及时释放
最佳实践
根据应用选择合适的方案
监控内存使用情况
处理分配失败
检测内存泄漏
预防堆栈溢出

方案选择决策树¶

开始
  ↓
是否需要动态分配？
  ├─ 否 → 使用静态分配
  └─ 是 → 是否需要释放内存？
          ├─ 否 → heap_1
          └─ 是 → 是否有多个RAM区域？
                  ├─ 是 → heap_5
                  └─ 否 → 是否对实时性要求极高？
                          ├─ 是 → 内存池 + heap_4
                          └─ 否 → heap_4

学习检查¶

完成本文后，你应该能够：

理解RTOS内存管理的核心概念和挑战
掌握FreeRTOS五种内存管理方案的特点
能够根据应用需求选择合适的方案
理解内存池的原理和实现
掌握内存碎片的产生原因和解决方法
能够监控和优化内存使用
知道如何处理内存分配失败
能够检测和预防内存泄漏

延伸阅读¶

参考资料¶

练习题：

概念理解：
解释heap_1和heap_4的主要区别
说明内存碎片是如何产生的，以及如何减少碎片
实践练习：
实现一个简单的内存池管理器
编写代码监控系统的内存使用情况
对比heap_1和heap_4的性能差异
设计思考：
设计一个数据采集系统的内存管理方案
分析如何在内存受限的系统中优化内存使用
设计一个内存泄漏检测机制
故障排除：
如何诊断和解决内存分配失败的问题？
如何检测和定位内存泄漏？
如何预防和处理堆栈溢出？

下一步：建议学习任务间通信方式对比，了解不同通信机制的内存开销和性能特点。

文档版本: 1.0
最后更新: 2024-01-15
作者: 嵌入式知识平台