1. 数组概念

变量是内存中的一个存储块,大小由声明时的数据类型决定。

数组可以认为是变量的集合,在内存中表现为一片连续的存储区域,其特点为:

  • 同类型多个变量的集合。
  • 每一个变量没有自己的名字。
  • 数组会为每一个变量分配一个位置编号 。
  • 可以通过变量在数组中的位置编号(下标)使用变量。

C++中称数组为复合类型,复合类型指除了基本类型之外或通过基本类型组合而成的新类型。如类、结构体、枚举……

数组是一种数据结构,与栈、队列、树、图……这类数结构不同,数组是实体数据结构,有自己的物理内存描述。栈、队列、树……是抽象数据结构,或者说是一种数据存储思想,没有对应的物理存储方案,需开发者自行设计逻辑存储方案。

什么时候使用数组?

在需要保存大量同类型数据的应用场景下可以考虑选择数组。因数组中的变量是相邻的,如同一条藤上的瓜(顺藤摸瓜),访问起来非常方便快捷。

大部分抽象数据结构的底层都可借助数组来实现。

连续存储的优点一眼可知,但是连续也会带来新的问题,程序运行过程中,会产生内存碎片,当数组需要的空间较大时,底层逻辑可能无法腾出一大片连续空间来。

当需要考虑充分利用空间时,链表当是首选。

下面,通过数组的使用流程,让我们全方面了解数组。

2. 创建数组

根据数组在内存中的存储位置,有 2 种创建方式:

  • 静态创建。
  • 动态创建。

2.1 静态创建

2.1.1 语法

创建数组时需要指定 3 方面信息:

  • 数组名数组名就是变量名,只是这个名称指的是一片连续区域。
  • 数据类型:数组用来保存什么样类型的数据。
  • 数组长度:编译器需要根据数组大小开辟空间。
  1. int num[10];

如上语法,创建了可以存储 10 个整型数据的数组。

创建数组后,怎么访问数组中的变量?

编译器会为数组中的 10int 存储块从 0开始编号。编号从 0开始,到数组长度-1结束,编号也称为下标。如果需要访问数组中的第一个变量中的数据,则如下代码可实现:

  1. int num[10];
  2. cout<<num[0]<<endl;

正因为数组的下标属性,数组通常借助循环语法结构进行整体遍历。

创建数组后是否存在数据?

遍历一次数组,便可以看到数组中所有的数据信息。

  1. int num[10];
  2. for(int i=0;i<10;i++){
  3. cout<<num[i]<<endl;
  4. }

输出结果可能会让你摸不着头。这是啥意思?

  1. 1
  2. 0
  3. 4254409
  4. 0
  5. 0
  6. 0
  7. 34
  8. 0
  9. 0
  10. 0

创建数组后,数组中会有数据信息,是内存中相应位置曾经存储过的或由编译器随机生成的数据。对于创建数组初衷(保存自己的数据)的你而言,这都是垃圾数据

随机数据:每一次运行上述代码,结果可能都不一样。

所以,必须对数组进行初始化,这样数组中的数据才会有意义。

2.1.2 初始化

初始化指创建数组后为数组中的变量指定初始值。

初始化语法:

  • 创建后通过循环语法结构赋值。
  1. int num[10];
  2. for(int i=0; i<10; i++) {
  3. num[i]=i*10;
  4. }
  • 单个变量赋值。
  1. int num[10];
  2. num[0]=10;
  • 边创建边赋值,{}符号可以用来表示数组字面常量。
  1. //正确
  2. int num[10]={1,3,4,9};

在赋值时,实际指定的值可以少于数组的长度。如果反过来,如下代码则行不通。

  1. //错误
  2. int num[3]={1,3,4,9};

上述赋值代码,实际值超过数组创建时的长度约束,语法上不能通过。如果边创建、边赋值分成 2 行,也是不行的。如下代码是错误的。

  1. int num[3];
  2. //错误
  3. num=={1,3,4,9};

如下代码,省略数组长度也是可以的,编译器会根据给定的值判断出数组长度。

  1. int num[]={1,3,4,9};
  • 全部初始化为 0。如下代码,初始化时只指定一个值且为 0 时,这里的语义不是指给数组中的第一个变量赋值,而是为数组中的所有变量指定初始值为 0
  1. int num[5]={0};
  2. //输出数组所有值
  3. for(int i=0; i<5; i++) {
  4. cout<<num[i]<<endl;
  5. }

输出结果:

  1. 0
  2. 0
  3. 0
  4. 0
  5. 0

如果用下面的代码进行初始化,语义是:数组的第一个变量赋值为 1,其余变量赋值都为 0

  1. int num[5]={1,0};
  2. for(int i=0; i<5; i++) {
  3. cout<<num[i]<<endl;
  4. }

输出结果:

  1. 1
  2. 0
  3. 0
  4. 0
  5. 0

理解上述语法的语义后,以此类推,对于下面的代码,想必很容易猜到输出结果:

  1. int num[5]={1,2,0};
  2. for(int i=0; i<5; i++) {
  3. cout<<num[i]<<endl;
  4. }
  • C++11中提供更清晰、简洁、安全的初始化语法。如下语法,是不是很简洁、惊艳。数组和{}之间可以不用等于号,太体贴了,生怕你多敲一个字母,会手痛。且为数组中的每一个变量赋值 0。没有多余的废话。
  1. int num[5] {};
  2. for(int i=0; i<5; i++) {
  3. cout<<num[i]<<endl;
  4. }

当然,你一定要加一个等于号让代码符合你曾经的认知也是可以的。

  1. int num[5]= {};

除此之外,对数组初始化时,禁止类型宿窄转换。如下代码,会有编译警告提示,2.5是浮点类型,存储存到 int类型数组中,是类型缩窄。C++11是禁止的。

  1. int num[5] ={3,2.5};

2.1.3 越界问题

C++中使用数组,没有访问越界一说。所谓访问越界,指下标超过数组创建时指定的大小范围。

越界在Java语言中认定是语法错误。

  1. int num[5];
  2. //理论是越界的
  3. num[6]=20;
  4. for(int i=0; i<7; i++) {
  5. //输出了 7 个数据
  6. cout<<num[i]<<endl;
  7. }

上述代码,创建数组时,确定了数组长度为 5,其有效下标应该是0~4。但 num[6]=20能正确执行且循环输出时居然能得到 20

  1. 0
  2. 0
  3. 34
  4. 0
  5. 0
  6. 0
  7. 20

C++并不会阻止你的访问超过数组边界,但是,开发者需要从源头上切断这种行为。类似于相邻两家,关系很好,相互之间不设阻隔墙,但不意味着你能随意出入对方家里。

2.2.4 数组与指针

数组在内存中的存储结构有 2 个部分:

  • 存储数组数据的内存区域。
  • 存储数组首地址的内存变量。

数组名本质是指针变量,保存着数组的首地址,也是第一个存储位置。

  1. int num[5]={4,1,8,2,6};
  2. cout<<"数组的地址:"<<num<<endl;
  3. //输出结果:
  4. //数组的地址:0x70fe00 16进制描述的内存地址

如果要得到数组第一个位置的数据,则需要使用*运算符。

  1. int num[5]={4,1,8,2,6};
  2. cout<<"数组中的第一个位置的数据:"<<*num<<endl;
  3. //数组中的第一个位置的数据:4

除了使用*运算符,还可以使用[下标]语法。两者语法上有差异,但是语义是一样的。可以认为[下标]访问语法是指针访问语法的简化版。

  1. int num[5]={4,1,8,2,6};
  2. cout<<"数组中的第一个位置的数据:"<<num[0]<<endl;
  3. //数组中的第一个位置的数据:4

如果要访问其它位置的数据,可以通过移动指针实现。

Tip: num+1可以让指针移到数组的下一个变量位置。这里的1具体移动多少,由创建数组时指定的数据类型决定,如本文数组是 int类型,1便是移动 4 字节

  1. int num[5]={4,1,8,2,6};
  2. cout<<"数组中第二个位置的数据:"<<*(num+1)<<endl;
  3. //数组中第二个位置的数据:1

当然,完全可以使用[下标]替代。

  1. int num[5]={4,1,8,2,6};
  2. cout<<"数组中第二个位置的数据:"<<num[1]<<endl;

指针是C++语言的一大特色,能够让开发者直接操作内存地址(属于直接硬件操作),正因为此原因,编译器无法干涉,所以指针移动的范围只受限于物理内存大小的影响。如下代码能正常运行。

  1. int num[5]={4,1,8,2,6};
  2. //完全超界,但人家就是能运行 ,指针的手能伸到天涯海角
  3. for(int i=0;i<1000000;i++){
  4. cout<<*(num+i)<<endl;
  5. }

了解指针的特性后,也就不会奇怪为什么访问数组时能够越界。使用指针时务必谨慎,需要靠个人行为对之约束。

2.2.5 小结

通过静态创建语法创建的数组,称为静态数组,其特点如下:

  • 编译时,就需要为数组指定大小,或说数组大小在编码时就必须给定。
  • 静态创建数组时不能使用 auto关键字。
  1. //错误语法
  2. auto num[5];
  • 数组名中保存有数组大小的信息。如下代码可以获取到数组长度。
  1. int num[10];
  2. //sizeof得到num实际占用的内存空间,以字节为单位
  3. int len=sizeof(num)/4;
  4. cout<<len;
  5. //输出:10
  • 静态数组的数据保存在中,在编译期间进行空间分配,在生命周期结束后自动回收。

2.2 动态创建

动态创建:指数组的大小可以在运行时动态指定,除此之外,和静态创建的底层区别在于存储位置的不同,动态创建的数组的数据存储在堆中。

堆的特点:

  • 开发者可以根据自己的需要提出空间使用申请。
  • 当空间不再需要时,开发者需要手动释放空间。

先看一下创建语法:

  1. int *num=new int[10];

代码解释:

  • num是指针变量,用来保存数组的首地址。
  • new是运算符,其作用是在堆中开辟空间,并把空间的首地址返回。
  • int[10],指开辟空间的大小,以及保存什么类型的数据。

num是首地址,也是数组中第一个位置的地址。

  1. int *num=new int[10];
  2. //初始化第一个位置的数据
  3. *num=10;
  4. cout<<"第一个位置的数据:"<<*num<<endl;

如下通过对整个数组进行初始化:

  1. int *num=new int[10];
  2. for(int i=0; i<10; i++) {
  3. *(num+i)=i*10;
  4. }
  5. for(int i=0; i<10; i++) {
  6. cout<<*(num+i)<<endl;
  7. }

输出结果:

  1. 0
  2. 10
  3. 20
  4. 30
  5. 40
  6. 50
  7. 60
  8. 70
  9. 80
  10. 90

同样可以使用[下标]语法结构,对访问数组。

  1. int *num=new int[10];
  2. for(int i=0; i<10; i++) {
  3. num[i]=i*10;
  4. }
  5. for(int i=0; i<10; i++) {
  6. cout<<num[i]<<endl;
  7. }

动态数组可以在运行时改变数组的大小。静态创建方式是一锤定音的买卖,一旦确定后,就不能再改变。如下代码是正确的。

  1. int *num=new int[10];
  2. num=new int[20];

正因为动态数组的动态性,无法通过代码获得它的长度。

  1. int *num=new int[10];
  2. cout<<sizeof(num)/4<<endl;
  3. //输出结果:2,并不是数组的长度。

当动态数组的使命结束后,开发者需要使用 delete运算符手动释放数组所占用的空间。

  1. int *num=new int[10];
  2. //delete num;语法上可行,会产生不确定行为
  3. delete [] num;

这里要注意,如果不加[],语法上是没有问题的,但是,会有不确定的因素存在,所以!请务必加[]

3. 数组性能分析

得益于数组内存结构的连续性,只要知道数据的位置,便能快速访问到。查询时间度复杂度可以达到O(1)。在查询类的应用场景下,数组存储方案应该成为首选。

当在数组中插入数据时,需要把数据向后移动为插入的数据挪出位置,且需要在创建数组时预留足够多的空间,否则会有数据丢失的风险。

  1. //最后一位为预留位置
  2. int num[10]= {1,2,3,4,5,6,7,8,9,0};
  3. for(int i=0; i<10; i++) {
  4. cout<<num[i]<<"\t";
  5. }
  6. cout<<endl;
  7. int newNum=0;
  8. int pos=0;
  9. cout<<"请输入要插入的数据:"<<endl;
  10. cin>>newNum;
  11. cout<<"请输入要插入的位置:"<<endl;
  12. cin>>pos;
  13. //从插入位置的数据向后移动
  14. for(int i=9; i>pos-1; i--) {
  15. num[i]=num[i-1];
  16. }
  17. num[pos-1]=newNum;
  18. for(int i=0; i<10; i++) {
  19. cout<<num[i]<<"\t";
  20. }

运行结果:

  1. 1 2 3 4 5 6 7 8 9 0
  2. 请输入要插入的数据:
  3. 13
  4. 请输入要插入的位置:
  5. 5
  6. 1 2 3 4 13 5 6 7 8 9

删除数据时,需要把数据删除位置之后的数据向删除位置移动(向前)。

  1. int num[10]= {1,2,3,4,5,6,7,8,9,10};
  2. for(int i=0; i<10; i++) {
  3. cout<<num[i]<<"\t";
  4. }
  5. cout<<endl;
  6. int pos=0;
  7. cout<<"请输入要删除的位置:"<<endl;
  8. cin>>pos;
  9. //从插入位置的数据向前移动
  10. for(int i=pos-1; pos<8; i++) {
  11. num[i]=num[i+1];
  12. }
  13. //最后一位补 0
  14. num[9]=0;
  15. for(int i=0; i<10; i++) {
  16. cout<<num[i]<<"\t";
  17. }

运行结果:

  1. 1 2 3 4 5 6 7 8 9 10
  2. 请输入要删除的位置:
  3. 4
  4. 1 2 3 5 6 7 8 9 10 0

在数组中插入、删除数据的时间复杂度为O(n)

在频繁需要插入、删除的应用场景下,可以选择比数组性能更好的链表。

4. 总结

本文介绍了数组的 2 种创建方式,并对数组的操作性能做了简单的分析。数组遍历时是通过底层的指针移动来实现的。指针是C系列语言的一大特点,是一把双刃剑,用的好能御敌千里之外,用的不好!bug满天飞。

C++ 炼气期之数组探幽的更多相关文章

  1. K8s炼气期(一)| minikube安装本地Kubenetes环境

    前言 根据Kubenetes学习路径的七大阶段,炼气期.筑基期.金丹期.元婴期.化神期.炼虚期.大乘期:开始炼气期的第一个小阶段,安装Kubenetes环境. 目录 1.安装kubectl 2.安装m ...

  2. [19/03/13-星期三] 数组_二维数组&冒泡排序&二分查找

    一.二维数组 多维数组可以看成以数组为元素的数组.可以有二维.三维.甚至更多维数组,但是实际开发中用的非常少.最多到二维数组(我们一般使用容器代替,二维数组用的都很少). [代码示例] import ...

  3. [19/03/12-星期二] 数组_遍历(for-each)&复制&java.util.Arrays类

    一.遍历 for-each即增强for循环,是JDK1.5新增加的功能,专门用于读取数组或集合中所有的元素,即对数组进行遍历. //数组遍历 for-each public class Test_03 ...

  4. C++ 炼气期之结构体

    1. 前言 随着计算机向着不同领域的延伸,数据的概念已经不仅局限于数值型数据,计算机需要处理大量的非数值.且复杂的类型数据. 为了能抽象地描述这些非数值.复杂类型的数据,C++引入了复合数据类型的概念 ...

  5. C++ 炼气期之基本结构语法中的底层逻辑

    1. 前言 从语言的分类角度而言,C++是一种非常特殊的存在.属于高级语言范畴,但又具有低级语言的直接访问硬件的能力,这也成就了C++语言的另类性,因保留有其原始特性,其语法并不象其它高级语言一样易理 ...

  6. C++ 炼气期之数据是主角

    1. 前言 数据在程序中的重要性,怎么强调都不为过,程序的本质就是通过提供数据处理逻辑,把数据从一种状态变成另一种状态的过程.处理逻辑一定是有针对性的,针对的是数据本身的特性. 只有了解了数据本身的内 ...

  7. C++ 炼气期之变量的生命周期和作用域

    1. 前言 什么是变量的生命周期? 从变量被分配空间到空间被收回的这一个时间段,称为变量的生命周期. 什么是变量的作用域? 在变量的生命周期内,其存储的数据并不是在任何地方都能使用,变量能使用的范围, ...

  8. C++ 炼气期之算术运算符

    1. 前言 编写程序时,数据确定后,就需要为数据提供相应的处理逻辑(方案或算法).所谓逻辑有 2 种存在形态: 抽象形态:存在于意识形态,强调思考过程,与具体的编程语言无关. 具体形态:通过代码来实现 ...

  9. C++ 练气期之函数探幽

    1. 函数基础 一个C++程序中,往往需要包含若干个函数,可以说函数是C++程序的基础组成元件,是程序中的头等公民. 如果要理解程序中使用函数的具体意义,则需要了解语言发展过程中致力要解决的 2 问题 ...

随机推荐

  1. 《码处高效:Java开发手册》之代码风格

    流水淡,碧天长,鸿雁成行.编码风格,简捷清爽,反引无限风光. 在美剧<硅谷>中有这样一个经典镜头,主人公 Richard 与同为开发工程师的女友闹分手,理由是两人对缩进方式有着截然不同的编 ...

  2. javaWeb代码整理02-jdbcTemplete数据库连接工具

    jar包: maven坐标: /**属于spring框架的包*/<dependency> <groupId>org.springframework</groupId> ...

  3. Linux中信号量的实现

    如果一个任务获取信号量失败,该任务就必须等待,直到其他任务释放信号量.本文的重点是,在Linux中,当有任务释放信号量之后,如何唤醒正在等待该信号量的任务. 信号量定义如下: struct semap ...

  4. k8s入门之基础环境准备(一)

    一.在虚拟机中安装Ubuntu20.04.4系统 1.下载Ubuntu20.04.4服务器版本系统 下载链接地址如下: https://mirrors.tuna.tsinghua.edu.cn/ubu ...

  5. BigInterger && BigDecimal

    BigInterger BigDecimal

  6. matplotlib画图工具/绘制散点图

    绘制散点图 import matplotlib.pyplot as plt fig=plt.figure() ax = fig.add_subplot(111) ax.scatter(x,y, s,c ...

  7. SmartIDE v0.1.16 已经发布 - 支持阿里&蚂蚁开源的国产 IDE OpenSumi

    SmartIDE v0.1.16 (Build 3137) 已经在2022年4月19日发布到稳定版通道,我们在这个版本中增加了阿里和蚂蚁发布的国产IDE OpenSumi的支持,以及其他一些改进.Sm ...

  8. Matlab学习笔记 绘图

    1.二维曲线(1)plot函数①plot函数的基本用法:plot(x,y),其中x和y分别用于存储x坐标和y坐标数据. >>x=[1,2,3]; >>y=[4,5,6]; &g ...

  9. MySQL字段约束条件、字段类型、存储引擎、配置文件

    字符编码与配置文件 # 查看MySQL默认字符编码 \s ''' 如果是5.X系列 显示的编码有很多种 Latin1 gbk 如果是8.X系列 显示的统一是utf8mb4 utf8mb4是utf8优化 ...

  10. Python技法:实用运维脚本编写(进程/文件/目录操作)

    Python在很大程度上可以对shell脚本进行替代.笔者一般单行命令用shell,复杂点的多行操作就直接用Python了.这篇文章就归纳一下Python的一些实用脚本操作. 1. 执行外部程序或命令 ...