SGI STL源码stl_vector.h分析
前言
vector 是最常用的 C++ 容器,其动态扩容的特性是普通数组不具备的,这大大增加了编程的灵活性。虽然平时用 vector 很多,也能基本理解其原理,但无法从深层次理解。直到研读了 vector 的源码,才能比较自信的说自己真正理解了 vector 的基本原理,正应了侯捷说的那句话:源码面前,了无密码。我会写两篇文章分别分析泛化 vector 和针对 bool 类型的特化 vector(即是 bit_vector,位向量容器)。本文将分析泛化的 vector 的源码。
vector概述
vector 是动态扩容的连续数组。普通数组是静态空间,一旦配置就无法改变,而 vector 是动态空间,其内部机制会自动扩充空间以容纳更多的元素。其动态扩容的具体过程:当容器没有备用空间时,会开辟一块大小是原空间两倍的新空间,将数据从原空间复制到新空间并释放原空间。因此,vector 提高了内存的合理利用和运用的灵活性,用户再也不用考虑数组的容量不足的问题。
vector部分源码
本文分析的 vector 源码来自侯捷老师《STL源码剖析》用的 SGI-STL-v2.91 的版本。其泛化版本的 vector 具体实现在 stl_vector.h 文件中,部分源码如下:
// alloc 是 SGI STL 的空间配置器
template<class T, class Alloc = alloc>
class vector {
public:
typedef T value_type;
typedef value_type* pointer;
typedef const value_type* const_pointer;
typedef value_type* iterator;
typedef const value_type* const_iterator;
typedef value_type& reference;
typedef const value_type& const_reference;
typedef size_t size_type;
typedef ptrdiff_t difference_type; #ifdef __STL_CLASS_PARTIAL_SPECIALIZATION //这里是反转迭代器,可先忽略
typedef reverse_iterator<const_iterator> const_reverse_iterator;
typedef reverse_iterator<iterator> reverse_iterator;
#endif protected:
// simple_alloc 是 SGI STL 的空间配置器,是源码所有容器都使用这个接口
typedef simple_alloc<value_type, Alloc> data_allocator; iterator start; //表示目前使用空间的头
iterator finish; //表示目前使用空间的尾
iterator end_of_storage; //表示目前可用空间的尾 void insert_aux(iterator position, const T& x);
void deallocate() {
if(start)
data_allocator::deallocate(start, end_of_storage - start);
}
void fill_initialize(size_type n, const T& value) {
start = allocate_and_fill(n, value);
finish = start + n;
end_of_storage = finish;
} public:
iterator begin() { return start; }
const_iterator begin() const { return start; }
iterator end() { return finish; }
const_iterator end() const { return finish; }
reverse_iterator rbegin() { return reverse_iterator(end()); }
const_reverse_iterator rbegin() const {
return const_reverse_iterator(end());
}
reverse_iterator rend() { return reverse_iterator(begin()); }
const_reverse_iterator rend() const {
return const_reverse_iterator(begin());
}
size_type size() const {
return size_type(end() - begin());
}
size_type max_size() const {
return size_type(-) / sizeof(T);
}
size_type capacity() const {
return size_type(end_of_storage - begin());
}
bool empty() const { return begin() == end(); } reference operator[](size_type n) {
return *(begin() + n);
}
const_reference operator[](size_type n) const {
return *(begin() + n);
} vector() : start(), finish(), end_of_storage() {}
vector(size_type n, const T& value) {
fill_initialize(n, value);
}
vector(int n, const T& value) {
fill_initialize(n, value);
}
vector(long n, const T& value) {
fill_initialize(n, value);
}
explicit vector(size_type n) {
fill_initialize(n, T());
}
vector(const vector<T, Alloc>& x) {
start = allocate_and_copy(x.end() - x.begin(), x.begin(), x.end());
finish = start + (x.end() - x.begin());
end_of_storage = finish;
}
template <class InputIterator>
vector(InputIterator first, InputIterator last) :
start(), finish(), end_of_storage()
{
range_initialize(first, last, iterator_category(first));
} ~vector() {
destroy(start, finish); //全局变量
deallocate();
} vector<T, Alloc>& operator=(const vector<T, Alloc>& x); void reverve(size_type n) {
if (capacity() < n) {
const size_type old_size = size();
iterator tmp = allocate_and_copy(n, start, finish);
destroy(start, finish);
deallocate();
start = tmp;
finish = start + old_size;
end_of_storage = start + n;
}
} reference front() { return *begin(); }
const_reference front() const { return *begin(); }
reference back() { return *(end() - ); }
const_reference back() const { return *(end() - ); } void push_back(const T& x) {
if (finish != end_of_storage) { //还有备用空间
construct(finish, x); //全局函数
++finish;
} else //无备用空间
insert_aux(end(), x); //成员函数,后续会分析
} void swap(vector<T, Alloc>& x) {
__STD::swap(start, x.start);
__STD::swap(finish, x.finish);
__STD::swap(end_of_storage, x.end_of_storage);
} //和push_back差别不大,只是插入位置不一样,复杂一点
iterator insert(iterator position, const T& x) {
size_type n = position - begin();
if (finish != end_of_storage && position == end()) {
construct(finish, x);
} else
insert_aux(position, x); return begin() + n;
} iterator insert(iterator position) {
insert(position, T());
} #ifdef __STL_MEMBER_TEMPLATES
template <class InputIterator>
void insert(iterator position, InputIterator first, InputIterator last)
{
range_insert(position, first, last, iterator_category(first));
}
#endif void insert(iterator pos, size_type n, const T& x); void insert(iterator pos, int n, const T& x) {
insert(pos, (size_type) n, x);
} void insert(iterator pos, long n, const T& x) {
insert(pos, (size_type) n, x);
} void pop_back() {
--finish;
destroy(finish); //finish->~T 这里仅仅是调用指针finish所指对象的析构函数,不能释放内存
} iterator erase(iterator position) {
//如果移除的不是最后一个元素
if (position + != end())
copy(position + , finish, position); //全局函数 --finish;
destroy(finish);
return position;
} //移除半开半闭区间[first, last)之间的所有元素,last指向的元素不被移除
iterator erase(iterator first, iterator last) {
iterator i = copy(last, finish, first);
//如果区间内元素的析构函数是trivial的,则什么也不做
//如果区间内元素的析构函数是non-trivial的,则依序调用其析构函数
destroy(i, finish);
finish = finish - (last - first); //重新调整finish
return first;
} void resize(size_type new_size, const T& x) {
if (new_size < size())
erase(begin() + new_size, end());
else
insert(end(), new_size - size(), x);
} void resize(size_type new_size) { resize(new_size, T()); } void clear() { erase(begin(), end()); } protected:
//配置空间并填满内容
iterator allocate_and_fill(size_type n, const T& x) {
iterator result = data_allocator::allocate(n);
__STL_TRY
{
uninitialized_fill_n(result, n, x);
return result;
}
__STL_UNWIND(data_allocator::deallocate(result, n));
}
/***********************后面还有********************************/
vector 迭代器
vector 维护的是一个连续空间所以无论其元素的型别为何,普通指针就可以作为 vector 的迭代器而满足所有必要条件,因为 vector 迭代器所需要的操作行为,如 operator*,operator++,operator--,operator+,operator-,operator+=,operator-=,普通指针就具备,从上面的源码就可以看出,vector 用的迭代器就是普通指针。但除 bool 类型,虽然普通指针一样适用,为提高空间利用率,源码为其设计的特化版本有设计专门的迭代器,下一篇文章会进一步探讨。
insert_aux源码分析
template <class T, class Alloc>
void vector<T, Alloc>::insert_aux(iterator position, const T& x) {
if (finish != end_of_storage) { //还有备用空间
//在备用空间的起始处构造一个元素,并以 vector 最后一个元素值为其初值
construct(finish, *(finish - ));
++finish;
T x_copy = x;
//全局函数,从后面finish-1往前复制[position,finish-2]的值
copy_backward(position, finish - , finish - );
*position = x_copy;
} else {
const size_type old_size = size();
const size_type len = old_size != ? * old_size : ; //为当前空间两倍大小
iterator new_start = data_allocator::allocate(len);
iterator new_finish = new_start;
__STL_TRY
{
//复制[start,position)复制到new_start,new_finish为new_start+(position-start)
new_finish = uninitialized_copy(start, position, new_start);
construct(new_finish, x);
++new_finish; //调整水位
//复制[position,finish)复制到new_finish
new_finish = uninitialized_copy(position, finish, new_finish);
}
catch(...) {
destroy(new_start, new_finish);
data_allocator::deallocate(new_start, len);
throw;
}
destroy(begin(), end()); //调用旧空间元素的析构函数
deallocate(); //释放旧空间
start = new_start;
finish = new_finish;
end_of_storage = new_start + len;
}
}
从上面的源码可以看出,所谓动态扩容,并不是在原空间之后接续新空间,因为无法保证原空间之后尚有可配置的空间。而是以原大小的两倍另外配置一块较大空间,然后将原内容拷贝过来(这里注意技巧,分两步,先拷贝[start,position),在新空间,然后空出position的位置,再拷贝[position,finish)到新空间),然后才在position位置构造新元素,并释放原空间。因此,对 vector 的任何操作需要注意,当引起空间重新配置时,指向原 vector 的所有迭代器就都失效。
insert源码分析
insert的实现其实和上述的insert_aux相仿,只是相对复杂一点,原理差不多就是当备用空间不够时,就开辟一个大一点的空间,注意这里不一定是旧空间大小的两倍,因为新插入的元素个数可能比旧空间的大小还要大,这就可能发生两倍空间不足以放下所有元素的情况。具体分析过程呈现在源码注释中,就不继续分析该函数了。
template <class T, class Alloc>
void vector<T, Alloc>::insert(iterator position, size_type n, const T& x) {
if (n != ) { //当 n != 0 才进行一下操作
if (size_type(end_of_storage - finish) >= n) {
//备用空间大于新增元素个数
T x_copy = x;
//计算插入点之后的现有元素个数
const size_type elems_after = finish - position;
iterator old_finish = finish;
if (elems_after > n) {
//插入点之后的现有元素个数大于新增元素个数
uninitialized_copy(finish - n, finish, finish);
finish += n;
copy_backward(position, old_finish - n, old_finish);
fill(position, position + n, x_copy);
} else {
//插入点之后的现有元素个数小于等于新增元素个数
uninitialized_fill_n(finish, n - elems_after, x_copy);
finish += n - elems_after;
uninitialized_copy(position, old_finish, finish);
finish += elems_after;
fill(position, old_finish, x_copy);
}
} else {
//备用空间小于新增元素个数(那就必须配置额外的内存)
//首先决定新长度:旧长度的两倍,或旧长度 + 新增元素个数
const size_type old_size = size();
const size_type len = old_size + max(old_size, n);
//以下配置新的vector空间
iterator new_start = data_allocator::allocate(len);
iterator new_finish = new_start;
__STL_TRY
{
//旧vector插入点之前的元素复制到新空间
new_finish = uninitialized_copy(start, position, new_start);
//新增元素填入新空间
new_finish = uninitialized_fill_n(new_finish, n, x);
//旧vector插入点之后的元素复制到新空间
new_finish = uninitialized_copy(position, finish, new_finish);
}
catch(...) {
//如果发生异常,实现commit和rollback操作
destroy(new_start, new_finish);
data_allocator::deallocate(new_start, len);
throw;
}
//以下清除并释放旧的vector
destroy(start, finish);
deallocate();
//以下调整水位
start = new_start;
finish = new_finish;
end_of_storage = new_start + len;
}
}
}
总结
至此,我觉得已经将 stl_vector.h 的核心代码分析清楚,并讲清 vector 的主要实现原理。敲代码,调试,理解并见于文字,这个过程让人有一种融会贯通的感觉,虽然花的时间比较长,但比只是浅藏辄止的理解好太多。学习还是需要脚踏实地,一步一个脚印,会让自己走得更稳,其实也更快!
SGI STL源码stl_vector.h分析的更多相关文章
- SGI STL源码stl_bvector.h分析
前言 上篇文章讲了 STL vector 泛化版本的实现,其采用普通指针作为迭代器,可以接受任何类型的元素.但如果用来存储 bool 类型的数据,可以实现功能,但每一个 bool 占一个字节(byte ...
- STL源码分析读书笔记--第二章--空间配置器(allocator)
声明:侯捷先生的STL源码剖析第二章个人感觉讲得蛮乱的,而且跟第三章有关,建议看完第三章再看第二章,网上有人上传了一篇读书笔记,觉得这个读书笔记的内容和编排还不错,我的这篇总结基本就延续了该读书笔记的 ...
- STL 源码分析六大组件-allocator
1. allocator 基本介绍 分配器(allocator))是C ++标准库的一个组件, 主要用来处理所有给定容器(vector,list,map等)内存的分配和释放.C ++标准库提供了默认使 ...
- STL 源码分析《1》---- list 归并排序的 迭代版本, 神奇的 STL list sort
最近在看 侯捷的 STL源码分析,发现了以下的这个list 排序算法,乍眼看去,实在难以看出它是归并排序. 平常大家写归并排序,通常写的是 递归版本..为了效率的考虑,STL库 给出了如下的 归并排序 ...
- stl源码分析之allocator
allocator封装了stl标准程序库的内存管理系统,标准库的string,容器,算法和部分iostream都是通过allocator分配和释放内存的.标准库的组件有一个参数指定使用的allocat ...
- STL源码分析与实现-stl_list容器
1. stl_list 介绍 今天我们来总结一下stl_List, 通过之前介绍单链表的文章,其实对链表的基本操作已经十分熟悉了,那对于stl_list,无非就是链表结构不一样,至于其中的增删改查的细 ...
- STL源码分析《4》----Traits技术
在 STL 源码中,到处可见 Traits 的身影,其实 Traits 不是一种语法,更确切地说是一种技术. STL库中,有一个函数叫做 advance, 用来将某个迭代器(具有指针行为的一种 cla ...
- STL源码分析《3》----辅助空间不足时,如何进行归并排序
两个连在一起的序列 [first, middle) 和 [middle, last) 都已经排序, 归并排序最核心的算法就是 将 [first, middle) 和 [middle, last) 在 ...
- STL"源码"剖析-重点知识总结
STL是C++重要的组件之一,大学时看过<STL源码剖析>这本书,这几天复习了一下,总结出以下LZ认为比较重要的知识点,内容有点略多 :) 1.STL概述 STL提供六大组件,彼此可以组合 ...
随机推荐
- keras计算指定层的输出
import keras model = keras.models.Sequential([ keras.layers.Dense(4, activation='relu', input_dim=1, ...
- 多线程中volatile关键字的作用
原文链接:https://blog.csdn.net/xuwentao37x/article/details/27804169 多线程的程序是出了名的难编写.难验证.难调试.难维护,这通常是件苦差事. ...
- 小程序列表倒计时 wxs 实现
效果 代码 js //拿到服务器时间 var serverLocalDate = data.serverLocalDate; //调用函数开始计时 this.serverLocalDate(serve ...
- wnmp安装配置的坑
1.下载安装nginx: nginx官网下载地址->下载nginx 下载任意版本.我下载的是1.13.12版本,解压到C:\wnmp\nginx(自己决定目录),运行nginx.exe. 访问h ...
- oracle的事务
一.事务 保证数据的一致性,有一组相关的dml语句组成,该组的dml语句要么全部成功,要么全部失败 如:网上转账就是典型的要用事物来处理,用以保证数据的一致性 二.事务和锁 当执行事物操作时(dml语 ...
- django 快速实现文件上传(四)
继博客(三)实现的, 建两个字段,username 用户存放用户名,headImg 用户存放上传文件的路径. 重新同步数据库: 提示: 这个可能是之前已创建了表中的一条记录,之后模型中增加了一个非空的 ...
- linux环境下使用jmeter进行压力测试
linux环境下使用jmeter进行压力测试 linux环境下使用就meter进行压力测试: linux环境部署: 在Linux服务器先安装jdk: 2.以jdk-8u172-linux-x64.ta ...
- dp,滚动数组优化
51Nod1084矩阵取数问题 V2 题意: 一个M*N矩阵中有不同的正整数,经过这个格子,就能获得相应价值的奖励,先从左上走到右下,再从右下走到左上.第1遍时只能向下和向右走,第2遍时只能向上和向左 ...
- Arcgis python输出当前窗口
import arcpy mxd = arcpy.mapping.MapDocument("CURRENT") mxdfile=arcpy.GetParameterAsText(0 ...
- mongodb的更新操作符
mongodb更新有两个命令:1).update()命令 db.collection.update( criteria, objNew, upsert, multi ) criteria : upda ...