背景

数据结构是指带有结构特性的数据元素的集合。在数据结构中，数据之间通过一定的组织结构关联在一起，便于计算机存储和使用。从大类划分，数据结构可以分为线性结构和非线性结构，适用于不同的应用场景。

线性结构：

　　线性结构作为最常用的数据结构，它的特点是单个数据之间存在一对一的线性关系。包含两种不同的存储结构：顺序存储结构和链式存储结构。顺序存储的线性表称为顺序表，顺序表中的存储元素是连续的。

（线性结构）

　　链式存储的线性表被叫做链表，链表中的存储元素不一定是连续的，元素节点中存放数据元素以及相邻元素的地址信息

　　线性结构常见的有：数组、队列、链表和栈。

非线性结构：

除了线性结构，其他的数据结构均为非线性结构，特点是单个数据之间存在多个对应关系，常见的有：二维数组，多维数组，广义表，树结构，图结构

（常见的非线性结构）

稀疏数组（Sparse Array）

在各种各样的数据结构中，最基础、最常用的是数组。数组可以非常直观的表示数据在一维或多维空间中的关系，与现实中的情形更接近，所以被大多数程序员当做"首选"的数据结构，然而，在部分应用场景中使用数组存储数据时会出现各种各样的情况，这是就需要在数组的基础上，对数据结构进行优化，衍生出稀疏数组等新的数据结构。

以五子棋局为例，我们应该如何存储棋盘上的落子情况呢？

（使用二位数组存储五子棋盘）

如果使用一个二维数组对棋盘落子进行存储，当我们拿到一个棋盘类数据内容时，大部分内容都是没有意义的0，有意义数据并不相邻，很多空间被浪费。对于五子棋来说，这个问题可能不是很明显，但如果"棋盘"足够大，被浪费的空间就会影响到软件的功能实现，此时引入稀疏数组（SparseArray）就具有了重要的意义。

稀疏数组将数组中的内容进行压缩，存储在一个更为精练的二维数组中，稀疏数组的本质其实就是用时间置换空间。

具体的处理的方法是：

该数组之中一共有几行几列进行记录
把相同元素内容忽略后，只记录具有不同内容单元的位置

稀疏数组的实现

节约存储空间显然是稀疏数组的一个优势，但是读取性能是否可以会比二维数组差很多？

为了讲清这个问题，我们可以先看一下Android中SparseArray的实现逻辑。SparseArray内部是通过两个数组来进行数据存储的。一个存储key，另外一个存储value。我们从源代码中能够看到key和value各自是用数组表示：

  private int[] mKeys;

   private Object[] mValues;

同时，SparseArray在存储和读取数据时候，使用的是二分查找法：

 public void put(int key, E value) {

        int i = ContainerHelpers.binarySearch(mKeys, mSize, key);

        ...

        }

 public E get(int key, E valueIfKeyNotFound) {

        int i = ContainerHelpers.binarySearch(mKeys, mSize, key);

        ...

        }

在put添加数据的时候，会使用二分查找法和之前的key比较当前我们添加的元素的key的大小，然后按照从小到大的顺序排列好。所以，SparseArray存储的元素都是按元素的key值从小到大排列好的。而在获取数据的时候，也是使用二分查找法判断元素的位置，这样可以使数据的获取变得更加高效。所以，在key的数据量（可以理解为棋盘上去掉空白后的棋子数量）不大时，稀疏数组读取性能是有保障的。

典型应用场景

做开发的都知道，想让系统变快有个最简单的办法就是加内存。对于程序可以做大量的缓存来加速，即所谓"空间换时间"。但是在特定环境，程序可使用的内存是有限的。

在移动设备上，内存是个稀缺资源，例如iPhone 7的内存为2G，而最新款的iPhone 13也仅为4G。所以，稀疏数组这种"时间换空间"的技术最早被广泛应用在移动开发领域。

除了移动端，另一个内存紧缺的运行环境是浏览器。虽然没有明文规定，但在业界的共同认知里，浏览器会对单一线程进行内存限制，例如64位的chrome，每个tab页的内存消耗不允许超过4G。这个限制，在单页面应用还不成熟的十几年前，不会成为问题。因为，那时大家所关注的，还是如何提升后端的处理性能，前端只是一种静态的网页表达方式。

随着前端工程化的高速发展，各种前端工程脚手架日渐成熟，WebComponent标准被提上日程，企业开始由C/S向B/S应用转型。这就要求前端开发者，需要面对单页面处理复杂业务数据的挑战。前端程序从最开始设计以及整个开发过程中都需要考虑内存的使用情况，尽可能的降低内存占用，防止网页崩溃。以前端电子表格为例，我们通常需要为用户提供上百万个单元格（100列 x 1万行），但其中有数据的单元格可能只有几百个。为了减少数据模型占用的内存，我们最终的解决方式是将表格的数据存储方式由常规数组改成稀疏数组，内存占用可以降低到几十分之一，以确保浏览器内存不会被撑爆。

（稀疏矩阵存储策略）

不只是“时间换空间”;

相较于传统的链式存储或是数组存储，稀疏矩阵存储构建了基于索引Key的数据字典。在松散布局的表格数据中，稀疏矩阵只会对非空数据进行存储，而不需要对空数据开辟额外的内存空间。

使用这种特殊的存储策略，除了可以降低内存占用，还使得数据片段化变得容易，可以随时框取整个数据层中的一片数据，进行序列化或反序列化，而无需处理同一数据结构内的其他数据。

借用这样的特性，我们可以随时替换或恢复整个存储结构中的任何一个级别的节点，以改变引用的方式高效解决了表格数据回滚和恢复，而这一点也是电子表格支持在线协同的技术基础。

总结

本节为大家介绍了稀疏数组的基础知识，技术实现和应用场景，以前端电子表格为例，展示了这个技术在节约内存空间，实现回滚恢复等领域的优势。

在后续我们还会继续为大家介绍更多严肃和有趣的内容~

觉得不错点个赞再走吧~

【月光宝盒get√】用时间置换空间，聊聊稀疏数组的那些事儿的更多相关文章

剑指offer-第五章优化时间和空间效率（数组中的逆序对的总数）
题目:在数组中如果两个数字的前面的数比后面的数大,则称为一对逆序对.输入一个数组求出数组中逆序对的总数. 以空间换时间:思路:借助一个辅助数组,将原来的数组复制到该数组中.然后将该数组分成子数组,然后 ...
剑指offer-第五章优化时间和空间效率（数组中出现次数超过一半的数字）
题目:输入一个数组,找出一个数字,它在数组中出现的次数超过数组的一半. 题目规定如果可以改变数组中元素的位置. 思路1:如果数组是排序的,那么中间元素的位置不就是次数超过数组一半的元素吗?是的,因此我 ...
java性能时间与空间消耗
Java性能时间与空间消耗一.减少时间消耗标准代码优化 (1) 将循环不变量的计算移出循环例如:for (int i=0; i<size()*2; i++) { ... } ------& ...
C/C++用匿名数据结构实现时间和空间名利双收
程序的时间和空间,往往是一对矛盾,比如计算CRC32的时候会用到余式表 DWORD *crcTable; // DWORD[256]; 余式表可以用某种规则计算生成,为缩短文章长度就不写出来了,总之要 ...
Linux学习之CentOS(十六)-----内存置换空间(swap)之建置（转）
内存置换空间(swap)之建置安装时一定需要的两个 partition 啰! 一个是根目录,另外一个就是 swap(内存置换空间), swap 的功能就是在应付物理内存不足的情况下所造成的内存延伸记 ...
测试Protobuffer的定义格式对其时间和空间的影响
测试Protobuffer格式的A命令转换为std::string的的字节个数,分别测试了工程中用到的几种命令: a)AddLayer:108 b)AddSource:209 c)MoveLayer: ...
protobuf中会严重影响时间和空间损耗的地方
http://blog.chinaunix.net/uid-26922071-id-3723751.html 当前项目中普遍用到GOOGLE 的一个开源大作PROTOBUF,把它作为网络应用层面的传输 ...
88、展示Tensorflow计算图上每个节点的基本信息以及运行时消耗的时间和空间
''' Created on May 24, 2017 @author: p0079482 ''' #使用程序输出日志 import tensorflow as tf with tf.Session( ...
HashSet扩容机制在时间和空间上的浪费，远大于你的想象
一:背景 1. 讲故事自从这个纯内存项目进了大客户之后,搞得我现在对内存和CPU特别敏感,跑一点数据内存几个G的上下,特别没有安全感,总想用windbg抓几个dump看看到底是哪一块导致的,是我的代 ...

随机推荐

【springboot】集成Druid 作为数据库连接池
转自:https://blog.csdn.net/cp026la/article/details/86508139 1. 引言用户的每一次请求几乎都会访问数据库,访问数据库需要向数据库获取链接,而数 ...
Qt Model/View（模型/视图）结构（无师自通）
Model/View(模型/视图)结构是 Qt 中用界面组件显示与编辑数据的一种结构,视图(View)是显示和编辑数据的界面组件,模型(Model)是视图与原始数据之间的接口. GUI 应用程序的一个 ...
WPF---数据绑定之Xml数据源（四）
一.场景现在外部有一xml文件,我们想将该xml文件中的内容绑定到ListView中,该如何实现? 二.实现 xml文件的内容如下: <?xml version="1.0" ...
seo高手教你seo优化排名该怎么做
seo高手教你seo优化排名该怎么做第一节:如何在本地搭建服务器环境本节课程主要是讲如何利用 Xampp在本地搭建服务器环境 .网站使用asp和php比较常见,当然,就目前而言,使用php搭建网站 ...
Cookie在哪里看
更多java学习请进: https://zhangjzm.gitee.io/self_study
https(ssl) 免费证书
https://letsencrypt.org/getting-started/ https://certbot.eff.org/lets-encrypt/centosrhel7-nginx http ...
为开源项目 go-gin-api 增加后台任务模块
目录任务管理界面 (WEB) 任务调度器任务执行器小结推荐阅读任务管理界面 (WEB) 支持在 WEB 界面中对任务进行管理,例如:新增任务.编辑任务.启用/禁用任务.手动执行任务等. ...
QT之ARM平台的移植
在开发板中运行QT程序的基本条件是具备QT环境,那么QT的移植尤为重要,接下载我将和小伙伴们一起学习QT的移植. 一.准备材料 tslib源码 qt-everywhere-src-5.12.9.t ...
Python - 3.8 新特性之仅位置参数 & 仅关键字参数
前置知识 Python 函数:https://www.cnblogs.com/poloyy/p/15092393.html 什么是仅限位置形参仅限位置形参是 Python 3.8 才有的新特性新增 ...
Docker（24）- docker login 命令详解
如果你还想从头学起 Docker,可以看看这个系列的文章哦! https://www.cnblogs.com/poloyy/category/1870863.html 作用登录 Docker 镜像仓 ...

【月光宝盒get√】用时间置换空间，聊聊稀疏数组的那些事儿

背景