前言

什么是初始化?为什么要初始化?静态变量和局部变量的初始化又有什么区别?实际应用中应该怎么做?本文将一一回答这些问题。

什么是初始化

初始化指的是对数据对象或者变量赋予初始值。例如:

int value = 8; //声明整型变量并初始化为8
int arr[] = {1,2,3}; //声明整型数组arr,并初始化其值为1,2,3

为什么要初始化

我们来看一个示例程序。
test0.c程序清单如下:

#include <stdio.h>
#include <stdlib.h>
int main(void)
{
    int sum;
    int randNum;
    while(10 > sum)
    {
        randNum =  rand() % 10;         sum += randNum;
        printf("rand num is %d,sum is %d\n",randNum,sum);
    }
    printf("the final sum is %d\n",sum);
    return 0;
}

程序随机产生0到9的数字,使得sum的值大于或等于10时,退出程序。
编译并运行:

gcc  -o test0 test0.c
./test0

运行结果如下(每次运行结果可能不同):

rand num is 3,sum is -4040865
rand num is 6,sum is -4040859
rand num is 7,sum is -4040852
rand num is 5,sum is -4040847
rand num is 3,sum is -4040844
rand num is 5,sum is -4040839
(省略其他内容)

从运行结果来看,程序并没有达到我们的预期,这是为什么呢?

很多读者可能已经知道,问题在于声明sum之后,没有为其赋初始值,在这样的情况下,sum的值是随机的,因此在一开始sum可能是一个很小的负数,导致多次循环出现。很显然,初始化避免使用了变量的“脏值”。而将sum的声明改成如下定义即可:

int sum = 0;

如果将sum声明为静态变量,情况又会如何呢?

//test1.c
#include <stdio.h>
#include <stdlib.h>
int main(void)
{
    static int sum;
    int randNum;
    while(10 > sum)
    {
        randNum =  rand() % 10;         sum += randNum;
        printf("rand num is %d,sum is %d\n",randNum,sum);
    }
    printf("the final sum is %d\n",sum);
    return 0;
}

编译并运行:

rand num is 3,sum is 3
rand num is 6,sum is 9
rand num is 7,sum is 16
the final sum is 16

在这种情况下,程序是能够符合我们预期的结果,这又是为什么呢?原因在于静态变量会被默认初始化。例如,int类型会被初始化为0。那么问题来了:

  • 为什么局部变量未初始化的时候的值是“脏值”?

  • 静态变量和局部变量为什么又不一样呢?

在解答上面这两个问题之前,我们需要简单了解一下程序的存储空间布局。

程序的存储空间布局

C程序主要由以下几部分组成:

  • 正文段。即机器指令部分,为防止意外被修改,设为只读。

  • 初始化数据段。它包含了程序中需要明确赋初值的静态变量。

  • 未初始化数据段。它包含了程序中未赋初值的或初始化为0的静态变量,在程序开始执行之前,内核将此段中的数据初始化为0。

  • 栈。它保存了自动(局部)变量以及函数调用所要的信息。

  • 堆。用于动态内存分配。例如使用malloc函数进行内存分配。

其中,正文段和数据段的内容是“静态”的,因为在程序被编译出来之后,在整个程序地址就确定了,而堆栈中的内容是”动态”变化的,它随着进行的运行而不断变化着,再加上栈随机化的策略,使得程序每次运行时,栈的地址也是不确定的。

局部变量和静态变量的初始化有何不同

有了前面的铺垫,就很好理解两者的差别了。
未初始化的局部变量位于栈中,它的位置是不确定的,因此其值也是不确定的。当然,在windows下它的值是0xcccccccc,而“烫”字在MBCS字符集中的值为0xcccccccc,你说巧不巧?

而静态变量就不一样的,它的地址是确定的,并且存放在了数据段,而程序在运行之前,未初始化数据段的内容可以很方便地统一被初始化为0。这也就解释了前面的两个示例程序的结果为什么会不一样。我们加上一些打印,来看一看是否真的如此?

//test2.c
#include <stdio.h>
#include <stdlib.h>
int main(void)
{
    static int sum;
    int randNum;
    while(10 > sum)
    {
        randNum =  rand() % 10;         sum += randNum;
        printf("rand num is %d,sum is %d\n",randNum,sum);
    }
    printf("the final sum is %d\n",sum);
    printf("sum addr %p,randNum addr %p\n",&sum,&randNum);
    return 0;
}

编译并运行:

gcc -o test2 test2.c

运行结果1:

rand num is 3,sum is 3
rand num is 6,sum is 9
rand num is 7,sum is 16
the final sum is 16
sum addr 0x60104c,randNum addr 0x7ffd0ea8cf54

运行结果2:

rand num is 3,sum is 3
rand num is 6,sum is 9
rand num is 7,sum is 16
the final sum is 16
sum addr 0x60104c,randNum addr 0x7ffff5e3ddb4

在这里,sum是静态局部变量,而randNun是局部变量(自动变量),因此可以发现,sum的地址值总是不变的,而randNum的值却不断变化着。我们也可以通过nm命令查看sum的地址:

nm test2 |grep sum
000000000060104c b sum.2805

总结

我们来总结一下本文的主要内容:

  • 如果变量是静态的,它会被初始化为0;如果变量是自动的,它不会被初始化。

  • 静态的变量包括全局变量、静态全局变量、静态局部变量。

  • 使用局部变量之前对其进行初始化,避免使用“脏值”。

  • 从可读性考虑,静态变量也建议显示初始化。

  • 初始化为0的静态变量仍然存在未初始化数据段中(BSS段)。

送几句熟悉的话给大家:

手持两把锟斤拷,
口中疾呼烫烫烫。
脚踏千朵屯屯屯,
笑看万物锘锘锘。

思考

test1.c的代码运行结果每次都一样吗?为什么?该如何修改才能使得每次的运行结果不一样?

栈随机化的作用是什么?

推荐阅读:

C语言入坑指南-数组之谜

一个命令帮你对文本排序

如何理解 Linux shell中“2>&1”?

推荐一款强大的在线编译器

Linux常用命令--系统状态篇

关注公众号【编程珠玑】,第一时间获取更多原创技术文章

C语言入坑指南-被遗忘的初始化的更多相关文章

  1. C语言入坑指南-缓冲区溢出

    前言 缓冲区溢出通常指的是向缓冲区写入了超过缓冲区所能保存的最大数据量的数据.如果说之前所提到的一些问题可能只是影响部分功能的实现,那么缓冲区溢出将可能会造成程序运行终止,被不安全代码攻击等严重问题, ...

  2. C语言入坑指南-数组之谜

    前言 在C语言中,数组和指针似乎总是"暧昧不清",有时候很容易把它们混淆.本文就来理一理数组和指针之间到底有哪些异同. 数组回顾 在分析之前,我们不妨回顾一下数组的知识.数组是可以 ...

  3. ElasticSearch入坑指南之概述及安装

    ---恢复内容开始--- ElasticSearch入坑指南之概述及安装 了解ElasticSearch ElasticSearch(简称ES)基于Lucene的分布式全文检索引擎.使用ES可以实现近 ...

  4. Rust入坑指南:核心概念

    如果说前面的坑我们一直在用小铲子挖的话,那么今天的坑就是用挖掘机挖的. 今天要介绍的是Rust的一个核心概念:Ownership.全文将分为什么是Ownership以及Ownership的传递类型两部 ...

  5. Rust入坑指南:鳞次栉比

    很久没有挖Rust的坑啦,今天来挖一些排列整齐的坑.没错,就是要介绍一些集合类型的数据类型."鳞次栉比"这个标题是不是显得很有文化? 在Rust入坑指南:常规套路一文中我们已经介绍 ...

  6. Rust入坑指南:齐头并进(上)

    我们知道,如今CPU的计算能力已经非常强大,其速度比内存要高出许多个数量级.为了充分利用CPU资源,多数编程语言都提供了并发编程的能力,Rust也不例外. 聊到并发,就离不开多进程和多线程这两个概念. ...

  7. electron入坑指南

    electron入坑指南 简介 electron 实际集成chrome浏览器和node环境, 运行你写的网页 app 基本目录结构 index.html 名称可以不是index, 这个文件与普通网页的 ...

  8. Elasticsearch入坑指南之RESTful API

    Elasticsearch入坑指南之RESTful API Tags:Elasticsearch ES为开发者提供了非常丰富的基于Http协议的Rest API,通过简单的Rest请求,就可以实现非常 ...

  9. eclipse中导入外部包却无法查看对应源码或Javadoc的入坑指南

    eclipse中导入外部包却无法查看对应源码或Javadoc的 入坑指南 出现这个错误的原因是,你虽然导入了.jar包,但没有配置对应的Javadoc或源码路径,所以在编辑器中无法查看源 码和对应AP ...

随机推荐

  1. wsgi 协议

    wsgi 协议 前言 本来没打算这么早就学习 wsgi 的,因为想要学习python 是如何处理网络请求的绕不开 wsgi,所以只好先学习一下 wsgi.先对 wsgi 有个印象,到了学习 Djang ...

  2. linux内核源码目录结构分析

    原文地址 /arch.arch是architecture的缩写.arch目录下是好多个不同架构的CPU的子目录,譬如arm这种cpu的所有文件都在arch/arm目录下,X86的CPU的所有文件都在a ...

  3. Python图像处理之验证码识别

      在上一篇博客Python图像处理之图片文字识别(OCR)中我们介绍了在Python中如何利用Tesseract软件来识别图片中的英文与中文,本文将具体介绍如何在Python中利用Tesseract ...

  4. asp.net core 依赖注入几种常见情况

    先读一篇注入入门 全面理解 ASP.NET Core 依赖注入, 学习一下基本使用 然后学习一招, 不使用接口规范, 直接写功能类, 一般情况下可以用来做单例. 参考https://www.cnblo ...

  5. Google Maps API Key申请办法(最新)

    之前的Google Maps Api的API Key很容易申请,只需要按照一个简单的表单提交部署的网站地址即可,自动生成API Key并给出引用的路径. 但是最近在处理另外一个项目的时候发现之前的这种 ...

  6. $_POST和$GLOBALS['HTTP_RAW_POST_DATA'] 的区别

    HTTP 协议是建立在 TCP/IP 协议之上的应用层规范,它把 HTTP 请求分为三个部分:请求行.请求头.消息主体.协议规定 POST 提交的数据必须放在消息主体(entity-body)中,但协 ...

  7. python面向对象学习(四)继承

    目录 1. 单继承 1.1 继承的概念.语法和特点 1.2 方法的重写 1.3 父类的 私有属性 和 私有方法 2. 多继承 2.1 多继承的使用注意事项 2.2 新式类与旧式(经典)类 1. 单继承 ...

  8. 解决PHP Redis扩展无法加载的问题(zend_new_interned_string in Unknown on line 0)

    出错代码如下 PHP Warning: PHP Startup: Unable to load 最近在工作中需要使用PHP访问Redis,从https://github.com/phpredis/ph ...

  9. js替换字符串中特殊字符

    var reg=/\\|\/|\?|\?|\*|\"|\“|\”|\'|\‘|\’|\<|\>|\{|\}|\[|\]|\[|\]|\:|\:|\.|\^|\$|\!|\~|\` ...

  10. https协议为什么比http协议更加安全

    一.http协议 http协议是一种网络传输协议,规定了浏览器和服务器之间的通信方式.位于网络模型中的应用层.(盗图小灰.ヾ(◍°∇°◍)ノ゙) 但是,它的信息传输全部是以明文方式,不够安全,很容易被 ...