Qt学习笔记9-存储容器
存储容器(containers)有时候也被称为集合(collections),是能够在内存中存储其它特定类型的对象,通常是一些常用的数据结构,一般是通用模板类的形式。C++ 提供了一套完整的解决方案,作为标准模板库(Standard Template Library)的组成部分,也就是常说的 STL。
Qt 提供了另外一套基于模板的容器类。相比 STL,这些容器类通常更轻量、更安全、更容易使用。如果你对 STL 不大熟悉,或者更喜欢 Qt 风格的 API,那么你就应该选择使用这些类。当然,你也可以在 Qt 中使用 STL 容器,没有任何问题。
Qt 的容器类都不继承QObject,都提供了隐式数据共享、不可变的特性,并且为速度做了优化,具有较低的内存占用量等。另外一点比较重要的,它们是线程安全的。这些容器类是平台无关的,即不因编译器的不同而具有不同的实现;隐式数据共享,有时也被称作“写时复制(copy on write)”,这种技术允许在容器类中使用传值参数,但却不会出现额外的性能损失。
Qt 提供了顺序存储容器:QList,QLinkedList,QVector,QStack和QQueue。对于绝大多数应用程序,QList是最好的选择。虽然它是基于数组实现的列表,但它提供了快速的向前添加和向后追加的操作。如果你需要链表,可以使用QLinkedList。如果你希望所有元素占用连续地址空间,可以选择QVector。QStack和QQueue则是 LIFO 和 FIFO 的。
Qt 还提供了关联容器:QMap,QMultiMap,QHash,QMultiHash和QSet。带有“Multi”字样的容器支持在一个键上面关联多个值。“Hash”容器提供了基于散列函数的更快的查找,而非 Hash 容器则是基于二分搜索的有序集合。
我们将 Qt 提供的各个容器类总结如下:
- QList
:这是至今为止提供的最通用的容器类。它将给定的类型 T 的对象以列表的形式进行存储,与一个整型的索引关联。QList在内部使用数组实现,同时提供基于索引的快速访问。我们可以使用 QList::append()和QList::prepend()在列表尾部或头部添加元素,也可以使用QList::insert()在中间插入。相比其它容器类,QList专门为这种修改操作作了优化。QStringList继承自QList 。 - QLinkedList
:类似于 QList,除了它是使用遍历器进行遍历,而不是基于整数索引的随机访问。对于在中部插入大量数据,它的性能要优于QList。同时具有更好的遍历器语义(只要数据元素存在,QLinkedList的遍历器就会指向一个合法元素,相比而言,当插入或删除数据时,QList的遍历器就会指向一个非法值)。 - QVector
:用于在内存的连续区存储一系列给定类型的值。在头部或中间插入数据可能会非常慢,因为这会引起大量数据在内存中的移动。 - QStack
:这是QVector的子类,提供了后进先出(LIFO)语义。相比QVector,它提供了额外的函数:push(),pop()和top()。 - QQueue
:这是QList的子类,提供了先进先出(FIFO)语义。相比QList,它提供了额外的函数:enqueue(),dequeue()和head()。 - QSet
:提供单值的数学上面的集合,具有快速的查找性能。 - QMap<Key, T>:提供了字典数据结构(关联数组),将类型 T 的值同类型 Key 的键关联起来。通常,每个键与一个值关联。QMap以键的顺序存储数据;如果顺序无关,QHash提供了更好的性能。
- QMultiMap<Key, T>:这是QMap的子类,提供了多值映射:一个键可以与多个值关联。
- QHash<Key, T>:该类同QMap的接口几乎相同,但是提供了更快的查找。QHash以字母顺序存储数据。
- QMultiHash<Key, T>:这是QHash的子类,提供了多值散列。
能够存储在容器中的数据必须是可赋值数据类型。所谓可赋值数据类型,是指具有默认构造函数、拷贝构造函数和赋值运算符的类型。绝大多数数据类型,包括基本类型,比如int
和 double
,指针,Qt 数据类型,例如QString
、QDate
和QTime
,都是可赋值数据类型。但是,QObject
及其子类(QWidget
、QTimer
等)都不是。也就是说,你不能使用QList<QWidget>
这种容器,因为QWidget
的拷贝构造函数和赋值运算符不可用。如果你需要这种类型的容器,只能存储其指针,也就是QList<QWidget *>
。
如果要使用QMap
或者QHash
,作为键的类型必须提供额外的辅助函数。QMap
的键必须提供operator<()
重载,QHash
的键必须提供operator==()
重载和一个名字是qHash()
的全局函数。
作为例子我们考虑如下代码:
1 | struct Movie |
作为 struct,我们当做纯数据类使用。这个类没有额外的构造函数,因此编译器会为我们生成一个默认构造函数。同时,编译器还会生成默认的拷贝构造函数和赋值运算符。这就满足了将其放入容器类存储的条件:
1 | QList<Movie> movs; |
Qt容器可以直接使用QDataStream
进行存取。此时,容器中所存储的类型必须也能够使用QDataStream
进行存储。这意味着,我们需要进行重载operator<<()
和operator>>()
运算符
1 | QDataStream &operator<<(QDataStream &out, const Movie &movie) |
根据数据结构的相关内容,我们有必要对这些容器类的算法复杂性进行定量分析。算法复杂度关心的是在数据量增长时,容器的每一个函数究竟有多快(或者多慢)。例如,向QLinkedList中部插入数据是一个相当快的操作,并且与QLinkedList中已经存储的数据量无关。另一方面,如果QVector中已经保存了大量数据,向QVector中部插入数据会非常慢,因为在内存中,有一半的数据必须移动位置。为了描述算法复杂度,我们引入 O 记号(大写字母 O,读作“大 O”):
- 常量时间:O(1)。如果一个函数的运行时间与容器中数据量无关,我们说这个函数是常量时间的。QLinkedList::insert()就是常量时间的。
- 对数时间:O(log n)。如果一个函数的运行时间是容器数据量的对数关系,我们说这个函数是对数时间的。qBinaryFind()就是对数时间的。
- 线性时间:O(n)。如果一个函数的运行时间是容器数据量的线性关系,也就是说直接与数量相关,我们说这个函数是线性时间的。QVector::insert()就是线性时间的。
- 线性对数时间:O(n log n)。线性对数时间要比线性时间慢,但是要比平方时间快。
- 平方时间:O(n²)。平方时间与容器数据量的平方关系。
基于上面的表示,我们看一下Qt顺序容器的算法复杂度
Qt顺序容器 | 查找 | 插入 | 前方添加 | 后方追加 |
---|---|---|---|---|
QLinkList<T> |
O(n) | O(1) | O(1) | O(1) |
QList<T> |
O(1) | O(n) | 统计O(1) | 统计O(1) |
QVector<T> |
O(1) | O(n) | O(n) | 统计O(1) |
QVector
、QHash
和QSet
的头部添加是统计意义上的 O(log n)。然而,通过给定插入之前的元素个数来调用QVector::reserve()
、QHash::reserve()
和QSet::reserve()
,我们可以把复杂度降到 O(1)。
QVector<T>
、QString
和QByteArray
在连续内存空间中存储数据。QList<T>
维护指向其数据的指针数组,提供基于索引的快速访问(如果 T 就是指针类型,或者是与指针大小相同的其它类型,那么 QList
的内部数组中存的就是其实际值,而不是其指针)。QHash<Key, T>
维护一张散列表,其大小与散列中数据量相同。为避免每次插入数据都要重新分配数据空间,这些类都提供了多余实际值的数据位。