进阶：内存对齐与位域

在C语言中，内存对齐（Memory Alignment） 和 位域（Bit Fields） 是与底层硬件和内存布局紧密相关的两个高级话题。内存对齐影响结构体的大小和访问效率，而位域允许我们精确控制结构成员所占的位数，节省内存空间。理解这些概念对于编写可移植、高性能以及节省内存的代码（尤其在嵌入式系统）至关重要。本章将详细讲解这两个主题。

📌 内存对齐（Memory Alignment）

内存对齐是指将数据存储在内存中时，其起始地址必须是某个值（通常是数据类型的大小或编译器指定的值）的倍数。例如，int 通常对齐到4字节边界，即地址能被4整除。CPU访问对齐的数据效率最高，未对齐的访问可能引发性能损失甚至硬件异常。

编译器会自动在结构体成员之间插入填充字节（padding），以保证每个成员都满足其对齐要求。

🔸 为什么需要内存对齐？

硬件原因：许多CPU只能从对齐的地址读取数据，否则会触发错误或多次内存访问。
性能原因：对齐的数据可以一次性读入CPU缓存或寄存器，未对齐的数据可能需要两次读取并拼接。
可移植性：不同的平台对对齐的要求不同，遵循对齐规则可以保证代码的可移植性。

🔸 对齐示例：结构体大小

#include <stdio.h>

struct A {
    char c;   // 1字节
    int i;    // 4字节
};

struct B {
    int i;    // 4字节
    char c;   // 1字节
};

int main() {
    printf("sizeof(struct A) = %zu\n", sizeof(struct A)); // 通常为8
    printf("sizeof(struct B) = %zu\n", sizeof(struct B)); // 通常为8
    return 0;
}

实际上，struct A 中 char 后面会填充3个字节，使 int 对齐到4字节边界；struct B 中 int 已经对齐，char 后面填充3个字节，使结构体总大小是最大成员对齐值的整数倍。两者大小相同，但内存布局不同。

对齐规则总结：

每个成员的起始偏移量必须能被其类型大小整除（或编译器指定的对齐值）。
结构体的总大小必须是其最大成员对齐值的整数倍。
编译器可能会在成员之间或末尾插入填充字节。

🎛️ 对齐控制

C语言提供了多种方式来控制内存对齐：

#pragma pack（编译器扩展）
__attribute__((packed))（GCC/Clang）
alignas 和 alignof（C11）

🔸 使用 #pragma pack 压缩结构体

#include <stdio.h>

#pragma pack(push, 1)   // 设置对齐为1字节，即取消对齐
struct Packed {
    char c;
    int i;
};
#pragma pack(pop)       // 恢复之前的对齐

struct Normal {
    char c;
    int i;
};

int main() {
    printf("Normal size: %zu\n", sizeof(struct Normal)); // 8
    printf("Packed size: %zu\n", sizeof(struct Packed)); // 5
    return 0;
}

注意： 压缩结构体会导致未对齐访问，在某些平台上可能引发总线错误或性能下降，应谨慎使用，通常仅用于网络协议包、文件格式等场景。

🔸 使用 attribute((packed))（GCC/Clang）

struct __attribute__((packed)) PackedGCC {
    char c;
    int i;
};

🔸 C11：alignof 与 alignas

alignof 获取类型的对齐要求，alignas 指定变量或类型的对齐方式。

#include <stdalign.h>
#include <stdio.h>

struct alignas(16) AlignedStruct {
    char c;
    int i;
};

int main() {
    printf("Alignof int: %zu\n", alignof(int));        // 4（通常）
    printf("Alignof AlignedStruct: %zu\n", alignof(struct AlignedStruct)); // 16
    printf("Sizeof AlignedStruct: %zu\n", sizeof(struct AlignedStruct));   // 16的倍数
    return 0;
}

注意： alignas 指定的对齐值必须大于等于类型默认对齐值，且应为2的幂。

🔢 位域（Bit Fields）

位域允许我们以位为单位指定结构体成员所占用的内存宽度，常用于：

节省内存（例如，存储布尔值或状态标志）。
直接操作硬件寄存器（每个位有特定含义）。
解析网络协议或文件格式中的比特位字段。

🔸 位域的定义与使用

#include <stdio.h>

struct Status {
    unsigned int ready   : 1;   // 占1位
    unsigned int error   : 1;   // 占1位
    unsigned int data    : 6;   // 占6位
    unsigned int reserved: 8;   // 占8位
};

int main() {
    struct Status s;
    s.ready = 1;
    s.error = 0;
    s.data = 42;
    s.reserved = 0;

    printf("Size of struct Status: %zu\n", sizeof(s));   // 通常为4（4字节足够容纳1+1+6+8=16位）
    printf("ready: %u, error: %u, data: %u\n", s.ready, s.error, s.data);
    return 0;
}

注意： 位域成员的类型通常为 unsigned int 或 int，C99还允许 _Bool。位域的总宽度不能超过其基础类型的宽度。

🔸 位域的内存布局

位域在内存中的排列顺序（从低位到高位还是从高位到低位）是编译器相关的，不同平台可能不同。因此，位域不适用于跨平台的数据交换，但非常适合嵌入式中的硬件寄存器映射。

// 假设硬件寄存器地址映射
struct HardwareReg {
    unsigned int enable    : 1;
    unsigned int interrupt : 1;
    unsigned int mode      : 2;
    unsigned int reserved  : 28;
};
volatile struct HardwareReg *reg = (struct HardwareReg*)0x40021000;

🔸 无名位域与填充

可以使用无名位域进行填充，跳过指定位数。

struct Flags {
    unsigned int flag1 : 1;
    unsigned int       : 2;   // 无名位域，占2位，用于填充
    unsigned int flag2 : 1;
};

🔸 位域的注意事项

不能对位域成员取地址（&s.ready 非法），因为位域可能不在字节边界上。
位域的可移植性较差：不同编译器对位域的存储顺序（大端/小端）、对齐方式、溢出处理可能不同。
如果位域成员的总宽度超过了基础类型，超出部分会被丢弃或存储到下一个基础类型单元，行为由实现定义。
位域不能跨越不同基础类型的边界（例如从int到short）。

📋 综合示例：学生信息压缩存储

使用位域和内存对齐控制来设计紧凑的结构体。

#include <stdio.h>
#include <stdint.h>

// 使用位域存储学生信息，节省内存
struct StudentCompact {
    unsigned int id      : 16;   // 学号占16位（0-65535）
    unsigned int age     : 7;    // 年龄0-127
    unsigned int gender  : 1;    // 0:女, 1:男
    unsigned int score   : 8;    // 成绩0-255
    // 总共16+7+1+8=32位，正好4字节
};

// 普通结构体对比
struct StudentNormal {
    uint16_t id;
    uint8_t age;
    uint8_t gender;
    uint8_t score;
    // 可能填充到4字节对齐，实际大小可能为6或8
};

int main() {
    printf("Compact size: %zu\n", sizeof(struct StudentCompact)); // 4
    printf("Normal size: %zu\n", sizeof(struct StudentNormal));   // 4 或更大（取决于填充）

    struct StudentCompact stu = {1001, 20, 1, 95};
    printf("ID: %u, Age: %u, Gender: %s, Score: %u\n",
           stu.id, stu.age, stu.gender ? "男" : "女", stu.score);

    return 0;
}

⚠️ 常见错误与注意事项

依赖结构体大小进行序列化：由于填充的存在，直接写入结构体二进制内容可能在不同编译器或平台间不兼容。应使用明确字节序和填充的序列化方式。
过度使用 #pragma pack：可能导致未对齐访问，降低性能甚至引起硬件异常。仅在必要时（如定义网络包结构）使用。
位域的跨平台假设：不同编译器和平台对位域的位顺序（大端/小端）处理不同，不要依赖位域进行跨平台数据交换。
位域成员超出范围：给位域赋超出其表示范围的值，行为是截断（实现定义），可能产生意想不到的结果。
忘记包含 stdalign.h：使用 alignof 和 alignas 时需要包含该头文件。
位域与联合体组合：常用于将寄存器的各个位与整体值同时访问。

🔸 联合体+位域示例：字节拆分

union ByteSplit {
    unsigned char byte;
    struct {
        unsigned int low  : 4;
        unsigned int high : 4;
    } bits;
};

int main() {
    union ByteSplit bs;
    bs.byte = 0xAB;   // 10101011
    printf("低4位: %X, 高4位: %X\n", bs.bits.low, bs.bits.high);
    return 0;
}

内存对齐和位域是C语言中与硬件紧密相关的底层特性。合理使用它们可以写出高效且节省内存的程序，但必须注意可移植性和安全性。建议在嵌入式、网络协议、文件格式解析等场景中使用，而在普通应用层代码中尽量依赖编译器的默认行为。

上一章: 常用数据结构实现下一章: 进阶：可变参数函数

C语言教程

进阶：内存对齐与位域

📌 内存对齐（Memory Alignment）

🔸 为什么需要内存对齐？

🔸 对齐示例：结构体大小

🎛️ 对齐控制

🔸 使用 #pragma pack 压缩结构体

🔸 使用 __attribute__((packed))（GCC/Clang）

🔸 C11：alignof 与 alignas

🔢 位域（Bit Fields）

🔸 位域的定义与使用

🔸 位域的内存布局

🔸 无名位域与填充

🔸 位域的注意事项

📋 综合示例：学生信息压缩存储

⚠️ 常见错误与注意事项

🔸 联合体+位域示例：字节拆分

🔸 使用 attribute((packed))（GCC/Clang）