Qt 学习之路 2（38）：存储容器

豆子 2013年1月14日 Qt 学习之路 2 38条评论

存储容器（containers）有时候也被称为集合（collections），是能够在内存中存储其它特定类型的对象，通常是一些常用的数据结构，一般是通用模板类的形式。C++ 提供了一套完整的解决方案，作为标准模板库（Standard Template Library）的组成部分，也就是常说的 STL。

Qt 提供了另外一套基于模板的容器类。相比 STL，这些容器类通常更轻量、更安全、更容易使用。如果你对 STL 不大熟悉，或者更喜欢 Qt 风格的 API，那么你就应该选择使用这些类。当然，你也可以在 Qt 中使用 STL 容器，没有任何问题。

本章的目的，是让你能够选择使用哪个容器，而不是告诉你这个类都哪些函数。这个问题可以在文档中找到更清晰的回答。

Qt 的容器类都不继承QObject，都提供了隐式数据共享、不可变的特性，并且为速度做了优化，具有较低的内存占用量等。另外一点比较重要的，它们是线程安全的。这些容器类是平台无关的，即不因编译器的不同而具有不同的实现；隐式数据共享，有时也被称作“写时复制（copy on write）”，这种技术允许在容器类中使用传值参数，但却不会出现额外的性能损失。遍历是容器类的重要操作。Qt 容器类提供了类似 Java 的遍历器语法，同样也提供了类似 STL 的遍历器语法，以方便用户选择自己习惯的编码方式。相比而言，Java 风格的遍历器更易用，是一种高层次的函数；而 STL 风格的遍历器更高效，同时能够支持 Qt 和 STL 的通用算法。最后一点，在一些嵌入式平台，STL 往往是不可用的，这时你就只能使用 Qt 提供的容器类，除非你想自己创建。顺便提一句，除了遍历器，Qt 还提供了自己的 foreach 语法（C++ 11 也提供了类似的语法，但有所区别，详见这里的 foreach 循环一节）。

Qt 提供了顺序存储容器：QList，QLinkedList，QVector，QStack和QQueue。对于绝大多数应用程序，QList是最好的选择。虽然它是基于数组实现的列表，但它提供了快速的向前添加和向后追加的操作。如果你需要链表，可以使用QLinkedList。如果你希望所有元素占用连续地址空间，可以选择QVector。QStack和QQueue则是 LIFO 和 FIFO 的。

Qt 还提供了关联容器：QMap，QMultiMap，QHash，QMultiHash和QSet。带有“Multi”字样的容器支持在一个键上面关联多个值。“Hash”容器提供了基于散列函数的更快的查找，而非 Hash 容器则是基于二分搜索的有序集合。

另外两个特例：QCache和QContiguousCache提供了在有限缓存空间中的高效 hash 查找。

我们将 Qt 提供的各个容器类总结如下：

QList<T>：这是至今为止提供的最通用的容器类。它将给定的类型 T 的对象以列表的形式进行存储，与一个整型的索引关联。QList在内部使用数组实现，同时提供基于索引的快速访问。我们可以使用 QList::append()和QList::prepend()在列表尾部或头部添加元素，也可以使用QList::insert()在中间插入。相比其它容器类，QList专门为这种修改操作作了优化。QStringList继承自QList<QString>。
QLinkedList<T>：类似于 QList，除了它是使用遍历器进行遍历，而不是基于整数索引的随机访问。对于在中部插入大量数据，它的性能要优于QList。同时具有更好的遍历器语义（只要数据元素存在，QLinkedList的遍历器就会指向一个合法元素，相比而言，当插入或删除数据时，QList的遍历器就会指向一个非法值）。
QVector<T>：用于在内存的连续区存储一系列给定类型的值。在头部或中间插入数据可能会非常慢，因为这会引起大量数据在内存中的移动。
QStack<T>：这是QVector的子类，提供了后进先出（LIFO）语义。相比QVector，它提供了额外的函数：push()，pop()和top()。
QQueue<T>：这是QList的子类，提供了先进先出（FIFO）语义。相比QList，它提供了额外的函数：enqueue()，dequeue()和head()。
QSet<T>：提供单值的数学上面的集合，具有快速的查找性能。
QMap<Key, T>：提供了字典数据结构（关联数组），将类型 T 的值同类型 Key 的键关联起来。通常，每个键与一个值关联。QMap以键的顺序存储数据；如果顺序无关，QHash提供了更好的性能。
QMultiMap<Key, T>：这是QMap的子类，提供了多值映射：一个键可以与多个值关联。
QHash<Key, T>：该类同QMap的接口几乎相同，但是提供了更快的查找。QHash以字母顺序存储数据。
QMultiHash<Key, T>：这是QHash的子类，提供了多值散列。

所有的容器都可以嵌套。例如，QMap<QString, QList<int> >是一个映射，其键是QString类型，值是QList<int>类型，也就是说，每个值都可以存储多个 int。这里需要注意的是，C++ 编译器会将连续的两个 > 当做输入重定向运算符，因此，这里的两个 > 中间必须有一个空格。

能够存储在容器中的数据必须是可赋值数据类型。所谓可赋值数据类型，是指具有默认构造函数、拷贝构造函数和赋值运算符的类型。绝大多数数据类型，包括基本类型，比如 int 和 double，指针，Qt 数据类型，例如QString、QDate和QTime，都是可赋值数据类型。但是，QObject及其子类（QWidget、QTimer等）都不是。也就是说，你不能使用QList<QWidget>这种容器，因为QWidget的拷贝构造函数和赋值运算符不可用。如果你需要这种类型的容器，只能存储其指针，也就是QList<QWidget *>。

如果要使用QMap或者QHash，作为键的类型必须提供额外的辅助函数。QMap的键必须提供operator<()重载，QHash的键必须提供operator==()重载和一个名字是qHash()的全局函数。

作为例子，我们考虑如下的代码：

struct Movie
{
int id;
QString title;
QDate releaseDate;
};

struct Movie

{

int id;

QString title;

QDate releaseDate;

};

作为 struct，我们当做纯数据类使用。这个类没有额外的构造函数，因此编译器会为我们生成一个默认构造函数。同时，编译器还会生成默认的拷贝构造函数和赋值运算符。这就满足了将其放入容器类存储的条件：

QList<Movie> movs;

1	QList<Movie> movs;

Qt 容器类可以直接使用QDataStream进行存取。此时，容器中所存储的类型必须也能够使用QDataStream进行存储。这意味着，我们需要重载operator<<()和operator>>()运算符：

QDataStream &operator<<(QDataStream &out, const Movie &movie)
{
out << (quint32)movie.id << movie.title
<< movie.releaseDate;
return out;
}

QDataStream &operator>>(QDataStream &in, Movie &movie)
{
quint32 id;
QDate date;

in >> id >> movie.title >> date;
movie.id = (int)id;
movie.releaseDate = date;
return in;
}

QDataStream &operator<<(QDataStream &out, const Movie &movie)

{

out << (quint32)movie.id << movie.title

<< movie.releaseDate;

return out;

}

QDataStream &operator>>(QDataStream &in, Movie &movie)

{

quint32 id;

QDate date;

in >> id >> movie.title >> date;

movie.id = (int)id;

movie.releaseDate = date;

return in;

}

根据数据结构的相关内容，我们有必要对这些容器类的算法复杂性进行定量分析。算法复杂度关心的是在数据量增长时，容器的每一个函数究竟有多快（或者多慢）。例如，向QLinkedList中部插入数据是一个相当快的操作，并且与QLinkedList中已经存储的数据量无关。另一方面，如果QVector中已经保存了大量数据，向QVector中部插入数据会非常慢，因为在内存中，有一半的数据必须移动位置。为了描述算法复杂度，我们引入 O 记号（大写字母 O，读作“大 O”）：

常量时间：O(1)。如果一个函数的运行时间与容器中数据量无关，我们说这个函数是常量时间的。QLinkedList::insert()就是常量时间的。
对数时间：O(log n)。如果一个函数的运行时间是容器数据量的对数关系，我们说这个函数是对数时间的。qBinaryFind()就是对数时间的。
线性时间：O(n)。如果一个函数的运行时间是容器数据量的线性关系，也就是说直接与数量相关，我们说这个函数是线性时间的。QVector::insert()就是线性时间的。
线性对数时间：O(n log n)。线性对数时间要比线性时间慢，但是要比平方时间快。
平方时间：O(n²)。平方时间与容器数据量的平方关系。

基于上面的表示，我们来看看 Qt 顺序容器的算法复杂度：

	查找	插入	前方添加	后方追加
`QLinkedList<T>`	O(n)	O(1)	O(1)	O(1)
`QList<T>`	O(1)	O(n)	统计 O(1)	统计 O(1)
`QVector<T>`	O(1)	O(n)	O(n)	统计 O(1)

上表中，所谓“统计”，意思是统计意义上的数据。例如“统计 O(1)”是说，如果只调用一次，其运行时间是 O(n)，但是如果调用多次（例如 n 次），则平均时间是 O(1)。

下表则是关联容器的算法复杂度：

	查找键		插入
	平均	最坏	平均	最坏
`QMap<Key, T>`	O(log n)	O(log n)	O(log n)	O(log n)
`QMultiMap<Key, T>`	O(log n)	O(log n)	O(log n)	O(log n)
`QHash<Key, T>`	统计 O(1)	O(n)	O(1)	统计 O(n)
`QSet<Key, T>`	统计 O(1)	O(n)	O(1)	统计 O(n)

QVector、QHash和QSet的头部添加是统计意义上的 O(log n)。然而，通过给定插入之前的元素个数来调用QVector::reserve()、QHash::reserve()和QSet::reserve()，我们可以把复杂度降到 O(1)。我们会在下面详细讨论这个问题。

QVector<T>、QString和QByteArray在连续内存空间中存储数据。QList<T>维护指向其数据的指针数组，提供基于索引的快速访问（如果 T 就是指针类型，或者是与指针大小相同的其它类型，那么 QList 的内部数组中存的就是其实际值，而不是其指针）。QHash<Key, T>维护一张散列表，其大小与散列中数据量相同。为避免每次插入数据都要重新分配数据空间，这些类都提供了多余实际值的数据位。

我们通过下面的代码来了解这一算法：

QString onlyLetters(const QString &in)
{
QString out;
for (int j = 0; j < in.size(); ++j) {
if (in[j].isLetter())
out += in[j];
}
return out;
}

QString onlyLetters(const QString &in)

{

QString out;

for (int j = 0; j < in.size(); ++j) {

if (in[j].isLetter())

out += in[j];

}

return out;

}

我们创建了一个字符串，每次动态追加一个字符。假设我们需要追加 15000 个字符。在算法运行过程中，当达到以下空间时，会进行重新分配内存空间，一共会有 18 次：4，8，12，16，20，52，116，244，500，1012，2036，4084，6132，8180，10228，12276，14324，16372。最后，这个 out 对象一共有 16372 个 Unicode 字符，其中 15000 个是有实际数据的。

上面的分配数据有些奇怪，其实是有章可循的：

QString每次分配 4 个字符，直到达到 20。
在 20 到 4084 期间，每次分配大约一倍。准确地说，每次会分配下一个 2 的幂减 12。（某些内存分配器在分配 2 的幂数时会有非常差的性能，因为他们会占用某些字节做预订）
自 4084 起，每次多分配 2048 个字符（4096 字节）。这是有特定意义的，因为现代操作系统在重新分配一个缓存时，不会复制整个数据；物理内存页只是简单地被重新排序，只有第一页和最后一页的数据会被复制。

QByteArray和QList<T>实际算法与QString非常类似。

对于那些能够使用memcpy()（包括基本的 C++ 类型，指针类型和 Qt 的共享类）函数在内存中移动的数据类型，QVector<T>也使用了类似的算法；对于那些只能使用拷贝构造函数和析构函数才能移动的数据类型，使用的是另外一套算法。由于后者的消耗更高，所以QVector<T>减少了超出空间时每次所要分配的额外内存数。

QHash<Key, T>则是完全不同的形式。QHash的内部散列表每次会增加 2 的幂数；每次增加时，所有数据都要重新分配到新的桶中，其计算公式是qHash(key) % QHash::capacity()（QHash::capacity()就是桶的数量）。这种算法同样适用于 QSet<T>和QCache<Key, T>。如果你不明白“桶”的概念，请查阅数据结构的相关内容。

对于大多数应用程序。Qt 默认的增长算法已经足够。如果你需要额外的控制，QVector<T>、QHash<Key, T>、QSet<T>、QString和QByteArray提供了一系列函数，用于检测和指定究竟要分配多少内存：

capacity()：返回实际已经分配内存的元素数目（对于QHash和QSet，则是散列表中桶的个数）
reserve(size)：为指定数目的元素显式地预分配内存。
squeeze()：释放那些不需要真实存储数据的内存空间。

如果你知道容器大约有多少数据，那么你可以通过调用reserve()函数来减少内存占用。如果已经将所有数据全部存入容器，则可以调用squeeze()函数，释放所有未使用的预分配空间。

Qt 学习之路 2（38）：存储容器的更多相关文章

Qt 学习之路 2（43）：QStringListModel
Qt 学习之路 2(43):QStringListModel 豆子 2013年2月13日 Qt 学习之路 2 38条评论上一章我们已经了解到有关 list.table 和 tree 三个最常用的视图 ...
Qt 学习之路 2（42）：QListWidget、QTreeWidget 和 QTableWidget
Qt 学习之路 2(42):QListWidget.QTreeWidget 和 QTableWidget 豆子 2013年2月5日 Qt 学习之路 2 38条评论上一章我们了解了 model/vie ...
Qt 学习之路 2（39）：遍历容器
Qt 学习之路 2(39):遍历容器豆子 2013年1月16日 Qt 学习之路 2 29条评论上一节我们大致了解了有关存储容器的相关内容.对于所有的容器,最常用的操作就是遍历.本章我们将详细了解有 ...
Qt 学习之路 2（66）：访问网络（2）
Home / Qt 学习之路 2 / Qt 学习之路 2(66):访问网络(2) Qt 学习之路 2(66):访问网络(2) 豆子 2013年10月31日 Qt 学习之路 2 27条评论上一 ...
Qt 学习之路 2（53）：自定义拖放数据
Qt 学习之路 2(53):自定义拖放数据豆子 2013年5月26日 Qt 学习之路 2 13条评论上一章中,我们的例子使用系统提供的拖放对象QMimeData进行拖放数据的存储.比如使用QM ...
Qt 学习之路 2（51）：布尔表达式树模型
Qt 学习之路 2(51):布尔表达式树模型豆子 2013年5月15日 Qt 学习之路 2 17条评论本章将会是自定义模型的最后一部分.原本打算结束这部分内容,不过实在不忍心放弃这个示例.来自于 ...
Qt 学习之路 2（40）：隐式数据共享
Qt 学习之路 2(40):隐式数据共享豆子 2013年1月21日 Qt 学习之路 2 14条评论 Qt 中许多 C++ 类使用了隐式数据共享技术,来最大化资源利用率和最小化拷贝时的资源消耗.当作为 ...
Qt 学习之路 2（33）：贪吃蛇游戏（3）
Qt 学习之路 2(33):贪吃蛇游戏(3) 豆子 2012年12月29日 Qt 学习之路 2 16条评论继续前面一章的内容.上次我们讲完了有关蛇的静态部分,也就是绘制部分.现在,我们开始添加游戏控 ...
Qt 学习之路 2（5）：自定义信号槽
Home / Qt 学习之路 2 / Qt 学习之路 2(5):自定义信号槽 Qt 学习之路 2(5):自定义信号槽豆子 2012年8月24日 Qt 学习之路 2 131条评论上一节我们详 ...

随机推荐

Spring总结九：事务管理机制
何为事务事务(Transaction),一般是指要做的或所做的事情.在计算机术语中是指访问并可能更新数据库中各种数据项的一个程序执行单元(unit).事务通常由高级数据库操纵语言或编程语言(如SQL ...
判断手机使用网络wifi 2G 3G
ConnectivityManager cManager = (ConnectivityManager) this .getSystemService(Context.CONNECTIVITY_SER ...
【总结整理】webGIS学习thinkGIS（四）WebGIS中通过行列号来换算出多种瓦片的URL 之离线地
http://www.thinkgis.cn/topic/541a5319da8db186fd06e097 1.前言在前面我花了两个篇幅来讲解行列号的获取,也解释了为什么要获取行列号.在这一章,我将 ...
SpringMVC 课程第一天
SpringMVC第一天框架课程 1. 课程计划第一天 1.SpringMVC介绍 2.入门程序 3.SpringMVC架构讲解 a) 框架结构 b) 组件说明 4.SpringMVC整合My ...
c语言实践创建两个包含8个元素的double类型数组，第二个元素的每个元素的值都是对应前一个元素的前n个元素的和
意思就是第二个元素的num[2]等于第一个元素的num[0]+num[1]+num[2] #define COUNT 8 int main(void) { double num1[COUNT]; do ...
lnmp+laravel部署到服务器出现 "GET / HTTP/1.1" 500 5
lnmp一键安装包直接下载安装,就可以了,在此不多说. 虚拟机配置给个参考(lnmp安装包) server { listen 80; #listen [::]:80; server_name www. ...
Filter过滤器简单学习
Servlet 过滤器方法过滤器是一个实现了 javax.servlet.Filter 接口的 Java 类.javax.servlet.Filter 接口定义了三个方法: 序号方法 & ...
css总结1：position定位:absolute/relative/fixed
1 [Positioning(定位)] Positioning作用:指定了元素的定位类型.position包括四个值:static,relative,fixed,absolute. css定位解析:元 ...
编写高质量代码改善C#程序的157个建议——建议33：避免在泛型类型中声明静态成员
建议33:避免在泛型类型中声明静态成员在上一建议中,已经理解了应该将MyList<int>和MyList<string>视作两个完全不同的类型,所以,不应该将MyList&l ...
Python htmlTestRunner生成测试报告Demo
#该代码段是ReadTxt_demo.py 的代码,用户读取txt 文件中的用户信息. #ReadTxt_demo.py def readTxt(filePath): fo = open(filePa ...

Qt 学习之路 2（38）：存储容器

Qt 学习之路 2（38）：存储容器

Qt 学习之路 2（38）：存储容器的更多相关文章

随机推荐

热门专题