在 C 语言里,除了常见的基本数据类型,还有一些自定义类型,它们能帮助我们更灵活地组织和管理数据。今天我们就来详细聊聊其中的联合体和枚举类型。
联合体(Union),也叫共用体,它的声明语法和结构体很相似。声明一个联合体,我们使用 union
关键字,后面跟上联合体的名称,然后在花括号里列出联合体的成员。示例如下:
#include
// 声明一个联合体
union Data {
int i;
float f;
char str[20];
};
在这个例子中,我们声明了一个名为 Data
的联合体,它包含三个成员:一个 int
类型的 i
,一个 float
类型的 f
,还有一个字符数组 str
。
联合体的最大特点就是所有成员共享同一块内存空间。也就是说,在同一时间,联合体只能存储一个成员的值。当我们给一个成员赋值时,其他成员的值就会被覆盖。以下是一个示例:
#include
union Data {
int i;
float f;
char str[20];
};
int main() {
union Data data;
data.i = 10;
printf("data.i: %d\n", data.i);
data.f = 220.5;
printf("data.f: %f\n", data.f);
// 此时 data.i 的值已经被覆盖,输出结果无意义
printf("data.i: %d\n", data.i);
return 0;
}
在这个程序中,我们先给 data.i
赋值为 10,然后打印它的值。接着给 data.f
赋值为 220.5,再打印 data.f
的值。这时,由于 data.f
覆盖了原来存储 data.i
的内存空间,所以再打印 data.i
时,输出的结果就没有意义了。
结构体和联合体在声明上很相似,但它们的内存使用方式截然不同。结构体的每个成员都有自己独立的内存空间,各个成员可以同时存储不同的值;而联合体的所有成员共享同一块内存空间,同一时间只能存储一个成员的值。以下是一个对比示例:
#include
// 定义一个结构体
struct StructData {
int i;
float f;
char str[20];
};
// 定义一个联合体
union UnionData {
int i;
float f;
char str[20];
};
int main() {
struct StructData structData;
union UnionData unionData;
printf("Size of struct StructData: %zu bytes\n", sizeof(structData));
printf("Size of union UnionData: %zu bytes\n", sizeof(unionData));
return 0;
}
运行这个程序,你会发现结构体的大小是其所有成员大小之和,而联合体的大小是其最大成员的大小。
联合体的大小计算遵循以下规则:
我们可以使用枚举类型定义变量,然后给变量赋值为枚举常量。示例如下:
union Un1
{
char c[5];
int i;
};
char c[5]
:char
类型每个元素占 1 字节,数组 c
包含 5 个元素,所以 c
占 5 字节。int i
:int
类型通常占 4 字节。char
类型对齐数为 1,char c[5]
整体对齐数也是 1。int
类型对齐数为 4。Un1
的最大对齐数是 4。char c[5]
大小为 5 字节,但要满足最大对齐数 4 的整数倍,所以 union Un1
的大小为 8 字节。列2:
union Un2
{
short c[7];
int i;
};
short c[7]
:short
类型每个元素占 2 字节,数组 c
包含 7 个元素,所以 c
占 2 * 7 = 14 字节。int i
:int
类型通常占 4 字节。short
类型对齐数为 2,short c[7]
整体对齐数也是 2。int
类型对齐数为 4。Un2
的最大对齐数是 4。short c[7]
大小为 14 字节,要满足最大对齐数 4 的整数倍,大于 14 且是 4 的整数倍的最小数是 16,所以 union Un2
的大小为 16 字节。我们可以用联合体判断大小端的存储
1. 大小端字节序的概念
在计算机中,多字节数据(如 int
类型,通常占 4 个字节)在内存中存储时,存在两种不同的字节序:
union
)的特性联合体的所有成员共享同一块内存空间,也就是说,联合体的不同成员在内存中起始地址是相同的。在这个函数中,定义了一个匿名联合体 un
,它包含两个成员:一个 int
类型的 i
和一个 char
类型的 c
。这意味着 i
和 c
会从内存的同一个位置开始存储。
#include
int check_sys()
{
union
{
int i;
char c;
} un;
un.i = 1;
return un.c; // 返回 1 是小端,返回 0 是大端
}
int main()
{
int result = check_sys();
if (result == 1)
{
printf("当前系统是小端字节序。\n");
}
else
{
printf("当前系统是大端字节序。\n");
}
return 0;
}
union
{
int i;
char c;
} un;
这里定义了一个匿名联合体 un
,其中 i
是 int
类型,通常占 4 个字节;c
是 char
类型,占 1 个字节。由于联合体的特性,i
和 c
共享同一块内存空间。
int
类型成员赋值un.i = 1;
将 un.i
赋值为 1。在二进制中,整数 1 用 32 位(假设 int
为 32 位)表示为 0000 0000 0000 0000 0000 0000 0000 0001
。
return un.c;
0000 0001
,由于 char
类型的 c
只占 1 个字节,且和 i
共享内存起始位置,所以 c
会取到 0000 0001
,即十进制的 1。因此,当返回值为 1 时,表示当前系统是小端字节序。0000 0000
,c
会取到 0000 0000
,即十进制的 0。所以,当返回值为 0 时,表示当前系统是大端字节序。枚举(Enum)类型是一种用户自定义的数据类型,它用于定义一组命名的整数常量。声明枚举类型使用 enum
关键字,后面跟上枚举类型的名称,然后在花括号里列出枚举常量。示例如下:
#include
// 声明一个枚举类型
enum Weekday {
MONDAY,
TUESDAY,
WEDNESDAY,
THURSDAY,
FRIDAY,
SATURDAY,
SUNDAY
};
在这个例子中,我们声明了一个名为 Weekday
的枚举类型,它包含了一周七天的枚举常量。默认情况下,第一个枚举常量的值为 0,后面的常量依次递增 1。所以 MONDAY
的值为 0,TUESDAY
的值为 1,以此类推。
MONDAY
、TUESDAY
等比直接使用数字 0、1 更直观。我们可以使用枚举类型定义变量,然后给变量赋值为枚举常量。示例如下:
#include
enum Weekday {
MONDAY,
TUESDAY,
WEDNESDAY,
THURSDAY,
FRIDAY,
SATURDAY,
SUNDAY
};
int main() {
enum Weekday today = WEDNESDAY;
switch (today) {
case MONDAY:
printf("Today is Monday.\n");
break;
case TUESDAY:
printf("Today is Tuesday.\n");
break;
case WEDNESDAY:
printf("Today is Wednesday.\n");
break;
case THURSDAY:
printf("Today is Thursday.\n");
break;
case FRIDAY:
printf("Today is Friday.\n");
break;
case SATURDAY:
printf("Today is Saturday.\n");
break;
case SUNDAY:
printf("Today is Sunday.\n");
break;
default:
printf("Invalid weekday.\n");
}
return 0;
}
在这个程序中,我们定义了一个 Weekday
类型的变量 today
,并将其赋值为 WEDNESDAY
。然后使用 switch
语句根据 today
的值输出相应的信息。
综上所述,联合体和枚举类型都是 C 语言中非常有用的自定义类型,它们能帮助我们更好地组织和管理数据,提高代码的可读性和可维护性。在实际编程中,我们可以根据具体的需求选择合适的类型来使用。