C语言联合体（union）的使用方法及其本质-union

转载自：https://blog.csdn.net/si_zhou_qun_84342712/article/details/53187106

1.联合体union的基本特性——和struct的同与不同

union，中文名“联合体、共用体”，在某种程度上类似结构体struct的一种数据结构，共用体(union)和结构体(struct)同样可以包含很多种数据类型和变量。不过区别也挺明显：结构体(struct)中所有变量是“共存”的——优点是“有容乃大”，全面；缺点是struct内存空间的分配是粗放的，不管用不用，全分配。而联合体(union)中是各变量是“互斥”的——缺点就是不够“包容”；但优点是内存使用更为精细灵活，也节省了内存空间。

2.双刃剑——多种访问内存途径共存

 //example

 #include<stdio.h>

 union var{

         long int l;

         int i;

 };

 main(){

         union var v;

         v.l = ;

         printf("v.l is %d\n",v.i);

         v.i = ;

         printf("now v.l is %ld! the address is %p\n",v.l,&v.l);

         printf("now v.i is %d! the address is %p\n",v.i,&v.i);

 }

 结果：

 v.l is

 now v.l is ! the address is 0xbfad1e2c

 now v.i is ! the address is 0xbfad1e2c

管union的叫共用体还真是贴切——完全就是共用一个内存首地址，并且各种变量名都可以同时使用，操作也是共同生效。如此多的access内存手段，确实好用，不过这些“手段”之间却没法互相屏蔽——就好像数组+下标和指针+偏移一样。

上例中我改了v.i的值，结果v.l也能读取，那么也许我还以为v.l是我想要的值呢，因为上边提到了union的内存首地址肯定是相同的，那么还有一种情况和上边类似：

一个int数组变量a，一个long int(32位机中，long int占4字节，与int相同)变量b，我即使没给int变量b赋值，因为数据类型相同，我使用int变量b也完全会拿出int数组a中的a[0]来，一些时候一不小心用上，还以为用的就是变量b呢~

这种逻辑上的错误是很难找出来的（只有当数据类型相去甚远的时候稍好，出个乱码什么的很容易发现错误）。

3.联合体union和大小端（big-endian、little-endian）：

 #include<stdio.h>

 union var{

         char c[];

         int i;

 };  

 int main(){

         union var data;

         data.c[] = 0x04;//因为是char类型，数字不要太大，算算ascii的范围~

         data.c[] = 0x03;//写成16进制为了方便直接打印内存中的值对比

         data.c[] = 0x02;

         data.c[] = 0x11;

 //数组中下标低的，地址也低，按地址从低到高，内存内容依次为：04,03,02,11。总共四字节！

 //而把四个字节作为一个整体（不分类型，直接打印十六进制），应该从内存高地址到低地址看，0x11020304，低位04放在低地址上。

         printf("%x\n",data.i);

 }

结果：
11020304
证明我的32位linux是小端（little-endian）

4.联合体union所占内存空间大小：

首先，union的首地址是固定的，那么，union到底总共有多大？根据一些小常识，做个不严谨不高深的基础版验证吧。

根据：分配栈空间的时候内存地址基本上是连续的，至少同类型能保证在一起，连续就说明，我如果弄三个结构体出来，他们三个地址应该连着，看一下三个地址的间隔就知道了。

 #include<stdio.h>

 union sizeTest{

         int a;

         double b;

 };

 main(){

         union sizeTest unionA;

         union sizeTest unionB;

         union sizeTest unionC;  

         printf("the initial address of unionA is %p\n",&unionA);

         printf("the initial address of unionB is %p\n",&unionB);

         printf("the initial address of unionC is %p\n",&unionC);

 }

打印，可以看到结果：

the initial address of unionA is 0xbf9b8df8
the initial address of unionB is 0xbf9b8e00
the initial address of unionC is 0xbf9b8e08

很容易看出，8,0,8，这间隔是8字节，按double走的。

怕不保险，再改一下，把int改成数组，其他不变：

 union sizeTest{

         int a[];

         double b;

 };

打印

the initial address of unionA is 0xbfbb7738
the initial address of unionB is 0xbfbb7760
the initial address of unionC is 0xbfbb7788

88-60=28
60-38=28
算错了？我说的可是16进制0x。那么0x28就是40个字节，正好是数组a的大小。

似乎忘了一个功能——sizeof()

用sizeof直接看，就知道union的大小了

         printf("the sizeof   of unionA is %d\n",sizeof(unionA));

         printf("the sizeof   of unionB is %d\n",sizeof(unionB));

         printf("the sizeof   of unionC is %d\n",sizeof(unionC));

         printf("the sizeof   of union is %d\n",sizeof(union sizeTest));

5.联合体union适用场合：

有了前边那个验证，基本可以确认，union的内存是照着里边占地儿最大的那个变量分的。

也就可以大胆的推测一下，这种union的使用场合，是各数据类型各变量占用空间差不多并且对各变量同时使用要求不高的场合（单从内存使用上，我觉得没错）。

像上边做的第二个测试，一个数组（或者更大的数组int a[100]），和一个或者几个小变量写在一个union里，实在没什么必要，节省的空间太有限了，还增加了一些风险（最少有前边提到的逻辑上的风险）。所以，从内存占用分析，这种情况不如直接struct。

不过话说回来，某些情况下虽然不是很节约内存空间，但是union的复用性优势依然存在啊，比如方便多命名，这种“二义性”，从某些方面也可能是优势。这种方法还有个好处，就是某些寄存器或通道大小有限制的情况下，可以分多次搬运。

6.本质&进阶：

根据union固定首地址和union按最大需求开辟一段内存空间两个特征，可以发现，所有表面的定义都是虚的，所谓联合体union，就是在内存给你划了一个足够用的空间，至于你怎么玩~它不管~！（何止是union和struct，C不就是玩地址么，所以使用C灵活，也容易犯错）

没错，union的成员变量是相当于开辟了几个接口（即union包含的变量）！但是，没开辟就不能用了？当然也能用！

写个小测试：

 #include<stdio.h>

 union u{

         int i;

         double d;//这个union有8字节大小

 };

 main(){

         union u uu;

         uu.i = ;

         printf("%d\n",uu.i);  

         char * c;

         c = (char *)&uu;//把union的首地址赋值、强转成char类型

         c[] = 'a';

         c[] = 'b';

         c[] = 'c';

         c[] = '\0';

         c[] = 'd';

         c[] = 'e';

 //最多能到c[7]

         printf("%s\n",c);//利用结束符'\0'打印字符串"abc"

         printf("%c %c %c %c %c %c\n",c[],c[],c[],c[],c[],c[]);

 }

C语言联合体（union）的使用方法及其本质-union的更多相关文章

联合体（union）的使用方法及其本质
转自:http://blog.csdn.net/huqinwei987/article/details/23597091 有些基础知识快淡忘了,所以有必要复习一遍,在不借助课本死知识的前提下做些推理判 ...
C语言联合体
C语言联合体Unions实例代码教程 - 联合是一种特殊的数据类型在C语言中,使您可以存储不同的数据类型相同的内存位置. 联合是一种特殊的数据类型在C语言中,使您可以存储不同的数据类型相同的内存位置. ...
Linq中Union与Contact方法用法对比
文章一开始,我们来看看下面这个简单的实例. 代码片段1: int[] ints1 = { 2, 4, 9, 3, 0, 5, 1, 7 }; int[] ints2 = { 1, 3, 6, 4, 4 ...
C语言处理CSV文件的方法(一)
什么是CSV文件 CSV是 Comma-separated values (逗号分隔值)的首字母缩写,它通常是以逗号且不仅限于逗号分隔各个值,我们都叫他CSV. 看下面的例子: China, Shan ...
Go语言中字符串的查找方法小结
这篇文章主要介绍了Go语言中字符串的查找方法小结,示例的main函数都是导入strings包然后使用其中的方法,需要的朋友可以参考下 1.func Contains(s, substr strin ...
Go 语言入门（二）方法和接口
写在前面在学习 Go 语言之前,我自己是有一定的 Java 和 C++ 基础的,这篇文章主要是基于A tour of Go编写的,主要是希望记录一下自己的学习历程,加深自己的理解 Go 语言入门(二 ...
Go语言接口内部布局和方法集详解
1. 接口值内部布局如果用户定义的类型实现了某个接口类型声明的一组方法,那么这个用户定义的类型的值就可以赋给这个接口类型的值.这个赋值会把用户定义的类型的值存入接口类型的值.赋值完成后得到的值称 ...
C#扫盲之：带你掌握C#的扩展方法、以及探讨扩展方法的本质、注意事项
1.为什么需要扩展方法 .NET3.5给我们提供了扩展方法的概念,它的功能是在不修改要添加类型的原有结构时,允许你为类或结构添加新方法. 思考:那么究竟为什么需要扩展方法呢,为什么不直接修改原有类型呢 ...
网络工程 POST与GET请求方法的本质区别
POST与GET请求方法的本质区别: 第一:GET用于信息获取,它是安全的(这里安全的含义是指非修改信息),而POST是用于修改服务器上资源的请求第二:GET请求的数据会附在URL之后,而POST把 ...

随机推荐

PHP中 spl_autoload_register() 函数用法
这篇文章主要介绍了PHP中spl_autoload_register()函数用法,结合实例形式分析了__autoload函数及spl_autoload_register函数的相关使用技巧,需要的朋友可 ...
js后端返回一个时间戳，用原生怎么对时间进行格式化？
function fn(time) { var date = new Date(time); var len = time.toString().length; // 时间戳不足13位则在后面加零 i ...
meta标签、常用的文字类标签及其区别
常用的文字类基本标签段落:p标题文字 :h1~h6超链接:a,必须属性href,后跟跳转地址图片:img,必须属性src,后跟图片地址字体斜体:em.i 文字加粗:b.strong文字下划线:u文字 ...
2013年NOIP普及组复赛题解
题目涉及算法: 计数问题:枚举: 表达式求值:栈: 小朋友的数字:动态规划: 车站分级:最长路. 计数问题题目链接:https://www.luogu.org/problem/P1980 因为数据量 ...
springboot2动态数据源的绑定
由于springboot2更新了绑定参数的api,部分springboot1用于绑定的工具类如RelaxedPropertyResolver已经无法在新版本中使用.本文实现参考了https://blo ...
HDU 1071
题意:就是求给你一个抛物线的三个点,第一个给定的点是抛物线的顶点,让你求直线p2p3与抛物线的定积分思路:因为题目条件给了顶点,所以直接用抛物线的顶点式去求. 本弱弱数学太差.还得复习一下公式 #i ...
html input onfocus
<input type="text" value="请输入内容" onfocus="javascript:if(this.value=='请输入 ...
webpack优化 -- compression-webpack-plugin 开启gzip
webpack优化 -- compression-webpack-plugin 开启gzip 打包的时候开启gzip可以大大减少体积,非常适合于上线部署.下面以vue-cli2.x项目为例,介绍如何在 ...
P1101 走迷宫一
题目描述大魔王抓住了爱丽丝,将她丢进了一口枯井中,并堵住了井口. 爱丽丝在井底发现了一张地图,他发现他现在身处一个迷宫当中,从地图中可以发现,迷宫是一个N*M的矩形,爱丽丝身处迷宫的左上角,唯一的出 ...
h5&css3
HTML5 HTML5简介万维网的核心语言.标准通用标记语言下的一个应用超文本标记语言(HTML)的第五次重大修改.作为新HTML语言,具有新的元素,属性和行为它具有更大的技术集,允许更多样化和强 ...

C语言联合体（union）的使用方法及其本质-union

C语言联合体（union）的使用方法及其本质-union的更多相关文章

随机推荐

热门专题