前言

vector 是最常用的 C++ 容器，其动态扩容的特性是普通数组不具备的，这大大增加了编程的灵活性。虽然平时用 vector 很多，也能基本理解其原理，但无法从深层次理解。直到研读了 vector 的源码，才能比较自信的说自己真正理解了 vector 的基本原理，正应了侯捷说的那句话：源码面前，了无密码。我会写两篇文章分别分析泛化 vector 和针对 bool 类型的特化 vector（即是 bit_vector，位向量容器）。本文将分析泛化的 vector 的源码。

vector概述

vector 是动态扩容的连续数组。普通数组是静态空间，一旦配置就无法改变，而 vector 是动态空间，其内部机制会自动扩充空间以容纳更多的元素。其动态扩容的具体过程：当容器没有备用空间时，会开辟一块大小是原空间两倍的新空间，将数据从原空间复制到新空间并释放原空间。因此，vector 提高了内存的合理利用和运用的灵活性，用户再也不用考虑数组的容量不足的问题。

vector部分源码

本文分析的 vector 源码来自侯捷老师《STL源码剖析》用的 SGI-STL-v2.91 的版本。其泛化版本的 vector 具体实现在 stl_vector.h 文件中，部分源码如下：

// alloc 是 SGI STL 的空间配置器

template<class T, class Alloc = alloc>

class vector {

public:

    typedef T value_type;

    typedef value_type* pointer;

    typedef const value_type* const_pointer;

    typedef value_type* iterator;

    typedef const value_type* const_iterator;

    typedef value_type& reference;

    typedef const value_type& const_reference;

    typedef size_t size_type;

    typedef ptrdiff_t difference_type;

#ifdef __STL_CLASS_PARTIAL_SPECIALIZATION  //这里是反转迭代器，可先忽略

  typedef reverse_iterator<const_iterator> const_reverse_iterator;

  typedef reverse_iterator<iterator> reverse_iterator;

#endif

protected:

    // simple_alloc 是 SGI STL 的空间配置器，是源码所有容器都使用这个接口

    typedef simple_alloc<value_type, Alloc> data_allocator;

    iterator start;           //表示目前使用空间的头

    iterator finish;          //表示目前使用空间的尾

    iterator end_of_storage;  //表示目前可用空间的尾

    void insert_aux(iterator position, const T& x);

    void deallocate() {

        if(start)

            data_allocator::deallocate(start, end_of_storage - start);

    }

    void fill_initialize(size_type n, const T& value) {

        start = allocate_and_fill(n, value);

        finish = start + n;

        end_of_storage = finish;

    }

public:

    iterator begin() { return start; }

    const_iterator begin() const { return start; }

    iterator end() { return finish; }

    const_iterator end() const { return finish; }

    reverse_iterator rbegin() { return reverse_iterator(end()); }

    const_reverse_iterator rbegin() const {

        return const_reverse_iterator(end());

    }

    reverse_iterator rend() { return reverse_iterator(begin()); }

    const_reverse_iterator rend() const {

        return const_reverse_iterator(begin());

    }

    size_type size() const {

        return size_type(end() - begin());

    }

    size_type max_size() const {

        return size_type(-) / sizeof(T);

    }

    size_type capacity() const {

        return size_type(end_of_storage - begin());

    }

    bool empty() const { return begin() == end(); }

    reference operator[](size_type n) {

        return *(begin() + n);

    }

    const_reference operator[](size_type n) const {

        return *(begin() + n);

    }

    vector() : start(), finish(), end_of_storage() {}

    vector(size_type n, const T& value) {

        fill_initialize(n, value);

    }

    vector(int n, const T& value) {

        fill_initialize(n, value);

    }

    vector(long n, const T& value) {

        fill_initialize(n, value);

    }

    explicit vector(size_type n) {

        fill_initialize(n, T());

    }

    vector(const vector<T, Alloc>& x) {

        start = allocate_and_copy(x.end() - x.begin(), x.begin(), x.end());

        finish = start + (x.end() - x.begin());

        end_of_storage = finish;

    }

    template <class InputIterator>

    vector(InputIterator first, InputIterator last) :

        start(), finish(), end_of_storage()

    {

        range_initialize(first, last, iterator_category(first));

    }

    ~vector() {

        destroy(start, finish);  //全局变量

        deallocate();

    }

    vector<T, Alloc>& operator=(const vector<T, Alloc>& x);

    void reverve(size_type n) {

        if (capacity() < n) {

            const size_type old_size = size();

            iterator tmp = allocate_and_copy(n, start, finish);

            destroy(start, finish);

            deallocate();

            start = tmp;

            finish = start + old_size;

            end_of_storage = start + n;

        }

    }

    reference front() { return *begin(); }

    const_reference front() const { return *begin(); }

    reference back() { return *(end() - ); }

    const_reference back() const { return *(end() - ); }

    void push_back(const T& x) {

        if (finish != end_of_storage) {  //还有备用空间

            construct(finish, x);  //全局函数

            ++finish;

        } else  //无备用空间

            insert_aux(end(), x);  //成员函数，后续会分析

    }

    void swap(vector<T, Alloc>& x) {

        __STD::swap(start, x.start);

        __STD::swap(finish, x.finish);

        __STD::swap(end_of_storage, x.end_of_storage);

    }

    //和push_back差别不大，只是插入位置不一样，复杂一点

    iterator insert(iterator position, const T& x) {

        size_type n = position - begin();

        if (finish != end_of_storage && position == end()) {

            construct(finish, x);

        } else

            insert_aux(position, x);

        return begin() + n;

    }

    iterator insert(iterator position) {

        insert(position, T());

    }

    #ifdef __STL_MEMBER_TEMPLATES

    template <class InputIterator>

    void insert(iterator position, InputIterator first, InputIterator last)

    {

        range_insert(position, first, last, iterator_category(first));

    }

    #endif

    void insert(iterator pos, size_type n, const T& x);

    void insert(iterator pos, int n, const T& x) {

        insert(pos, (size_type) n, x);

    }

    void insert(iterator pos, long n, const T& x) {

        insert(pos, (size_type) n, x);

    }

    void pop_back() {

        --finish;

        destroy(finish);    //finish->~T 这里仅仅是调用指针finish所指对象的析构函数，不能释放内存

    }

    iterator erase(iterator position) {

        //如果移除的不是最后一个元素

        if (position +  != end())

            copy(position + , finish, position);  //全局函数

        --finish;

        destroy(finish);

        return position;

    }

    //移除半开半闭区间[first, last)之间的所有元素，last指向的元素不被移除

    iterator erase(iterator first, iterator last) {

        iterator i = copy(last, finish, first);

        //如果区间内元素的析构函数是trivial的，则什么也不做

        //如果区间内元素的析构函数是non-trivial的，则依序调用其析构函数

        destroy(i, finish);

        finish = finish - (last - first);    //重新调整finish

        return first;

    }

    void resize(size_type new_size, const T& x) {

        if (new_size < size())

            erase(begin() + new_size, end());

        else

            insert(end(), new_size - size(), x);

    }

    void resize(size_type new_size) { resize(new_size, T()); }

    void clear() { erase(begin(), end()); }

protected:

    //配置空间并填满内容

    iterator allocate_and_fill(size_type n, const T& x) {

        iterator result = data_allocator::allocate(n);

        __STL_TRY

        {

            uninitialized_fill_n(result, n, x);

            return result;

        }

        __STL_UNWIND(data_allocator::deallocate(result, n));

    }

template <class ForwardIterator>

iterator allocate_and_copy(size_type n,

ForwardIterator first, ForwardIterator last) {

iterator result = data_allocator::allocate(n);

__STL_TRY {

uninitialized_copy(first, last, result);

return result;

}

__STL_UNWIND(data_allocator::deallocate(result, n));

}

/***********************后面还有********************************/

vector 迭代器

vector 维护的是一个连续空间所以无论其元素的型别为何，普通指针就可以作为 vector 的迭代器而满足所有必要条件，因为 vector 迭代器所需要的操作行为，如 operator*，operator++，operator--，operator+，operator-，operator+=，operator-=，普通指针就具备，从上面的源码就可以看出，vector 用的迭代器就是普通指针。但除 bool 类型，虽然普通指针一样适用，为提高空间利用率，源码为其设计的特化版本有设计专门的迭代器，下一篇文章会进一步探讨。

insert_aux源码分析

insert_aux和insert两个函数是 vector 实现动态扩容的关键，具体源码如下：

template <class T, class Alloc>

void vector<T, Alloc>::insert_aux(iterator position, const T& x) {

    if (finish != end_of_storage) {  //还有备用空间

        //在备用空间的起始处构造一个元素，并以 vector 最后一个元素值为其初值

        construct(finish, *(finish - ));

        ++finish;

        T x_copy = x;

        //全局函数，从后面finish-1往前复制[position,finish-2]的值

        copy_backward(position, finish - , finish - );

        *position = x_copy;

    } else {

        const size_type old_size = size();

        const size_type len = old_size !=  ?  * old_size : ;  //为当前空间两倍大小

        iterator new_start = data_allocator::allocate(len);

        iterator new_finish = new_start;

        __STL_TRY

        {

            //复制[start,position)复制到new_start，new_finish为new_start+(position-start)

            new_finish = uninitialized_copy(start, position, new_start);

            construct(new_finish, x);

            ++new_finish; //调整水位

            //复制[position,finish)复制到new_finish

            new_finish = uninitialized_copy(position, finish, new_finish);

        }

        catch(...) {

            destroy(new_start, new_finish);

            data_allocator::deallocate(new_start, len);

            throw;

        }

        destroy(begin(), end()); //调用旧空间元素的析构函数

        deallocate(); //释放旧空间

        start = new_start;

        finish = new_finish;

        end_of_storage = new_start + len;

    }

}

从上面的源码可以看出，所谓动态扩容，并不是在原空间之后接续新空间，因为无法保证原空间之后尚有可配置的空间。而是以原大小的两倍另外配置一块较大空间，然后将原内容拷贝过来（这里注意技巧，分两步，先拷贝[start,position)，在新空间，然后空出position的位置，再拷贝[position,finish)到新空间），然后才在position位置构造新元素，并释放原空间。因此，对 vector 的任何操作需要注意，当引起空间重新配置时，指向原 vector 的所有迭代器就都失效。

insert源码分析

insert的实现其实和上述的insert_aux相仿，只是相对复杂一点，原理差不多就是当备用空间不够时，就开辟一个大一点的空间，注意这里不一定是旧空间大小的两倍，因为新插入的元素个数可能比旧空间的大小还要大，这就可能发生两倍空间不足以放下所有元素的情况。具体分析过程呈现在源码注释中，就不继续分析该函数了。

template <class T, class Alloc>

void vector<T, Alloc>::insert(iterator position, size_type n, const T& x) {

    if (n != ) {  //当 n != 0 才进行一下操作

        if (size_type(end_of_storage - finish) >= n) {

            //备用空间大于新增元素个数

            T x_copy = x;

            //计算插入点之后的现有元素个数

            const size_type elems_after = finish - position;

            iterator old_finish = finish;

            if (elems_after > n) {

                //插入点之后的现有元素个数大于新增元素个数

                uninitialized_copy(finish - n, finish, finish);

                finish += n;

                copy_backward(position, old_finish - n, old_finish);

                fill(position, position + n, x_copy);

            } else {

                //插入点之后的现有元素个数小于等于新增元素个数

                uninitialized_fill_n(finish, n - elems_after, x_copy);

                finish += n - elems_after;

                uninitialized_copy(position, old_finish, finish);

                finish += elems_after;

                fill(position, old_finish, x_copy);

            }

        } else {

            //备用空间小于新增元素个数（那就必须配置额外的内存）

            //首先决定新长度：旧长度的两倍，或旧长度 + 新增元素个数

            const size_type old_size = size();

            const size_type len = old_size + max(old_size, n);

            //以下配置新的vector空间

            iterator new_start = data_allocator::allocate(len);

            iterator new_finish = new_start;

            __STL_TRY

            {

                //旧vector插入点之前的元素复制到新空间

                new_finish = uninitialized_copy(start, position, new_start);

                //新增元素填入新空间

                new_finish = uninitialized_fill_n(new_finish, n, x);

                //旧vector插入点之后的元素复制到新空间

                new_finish = uninitialized_copy(position, finish, new_finish);

            }

            catch(...) {

                //如果发生异常，实现commit和rollback操作

                destroy(new_start, new_finish);

                data_allocator::deallocate(new_start, len);

                throw;

            }

            //以下清除并释放旧的vector

            destroy(start, finish);

            deallocate();

            //以下调整水位

            start = new_start;

            finish = new_finish;

            end_of_storage = new_start + len;

        }

    }

}

总结

至此，我觉得已经将 stl_vector.h 的核心代码分析清楚，并讲清 vector 的主要实现原理。敲代码，调试，理解并见于文字，这个过程让人有一种融会贯通的感觉，虽然花的时间比较长，但比只是浅藏辄止的理解好太多。学习还是需要脚踏实地，一步一个脚印，会让自己走得更稳，其实也更快！

SGI STL源码stl_vector.h分析的更多相关文章

SGI STL源码stl_bvector.h分析
前言上篇文章讲了 STL vector 泛化版本的实现,其采用普通指针作为迭代器,可以接受任何类型的元素.但如果用来存储 bool 类型的数据,可以实现功能,但每一个 bool 占一个字节(byte ...
STL源码分析读书笔记--第二章--空间配置器（allocator）
声明:侯捷先生的STL源码剖析第二章个人感觉讲得蛮乱的,而且跟第三章有关,建议看完第三章再看第二章,网上有人上传了一篇读书笔记,觉得这个读书笔记的内容和编排还不错,我的这篇总结基本就延续了该读书笔记的 ...
STL 源码分析六大组件-allocator
1. allocator 基本介绍分配器(allocator))是C ++标准库的一个组件, 主要用来处理所有给定容器(vector,list,map等)内存的分配和释放.C ++标准库提供了默认使 ...
STL 源码分析《1》---- list 归并排序的迭代版本，神奇的 STL list sort
最近在看侯捷的 STL源码分析,发现了以下的这个list 排序算法,乍眼看去,实在难以看出它是归并排序. 平常大家写归并排序,通常写的是递归版本..为了效率的考虑,STL库给出了如下的归并排序 ...
stl源码分析之allocator
allocator封装了stl标准程序库的内存管理系统,标准库的string,容器,算法和部分iostream都是通过allocator分配和释放内存的.标准库的组件有一个参数指定使用的allocat ...
STL源码分析与实现-stl_list容器
1. stl_list 介绍今天我们来总结一下stl_List, 通过之前介绍单链表的文章,其实对链表的基本操作已经十分熟悉了,那对于stl_list,无非就是链表结构不一样,至于其中的增删改查的细 ...
STL源码分析《4》----Traits技术
在 STL 源码中,到处可见 Traits 的身影,其实 Traits 不是一种语法,更确切地说是一种技术. STL库中,有一个函数叫做 advance, 用来将某个迭代器(具有指针行为的一种 cla ...
STL源码分析《3》----辅助空间不足时，如何进行归并排序
两个连在一起的序列 [first, middle) 和 [middle, last) 都已经排序, 归并排序最核心的算法就是将 [first, middle) 和 [middle, last) 在 ...
STL"源码"剖析-重点知识总结
STL是C++重要的组件之一,大学时看过<STL源码剖析>这本书,这几天复习了一下,总结出以下LZ认为比较重要的知识点,内容有点略多 :) 1.STL概述 STL提供六大组件,彼此可以组合 ...

随机推荐

1 Mybatis
1 使用Maven导入mybatis依赖在pom.xml中写上一下代码:这些代码的查找可在https://mvnrepository.com/open-source网站上寻找,导入mybatis时要 ...
JavaScript复制内容到剪贴板 clipboard.js
参考链接: https://github.com/axuebin/articles/issues/26#issuecomment-466337929
Mysql 修改最大链接数
链接数过小经常出现ERROR 1040: Too many connections错误 show variables like '%max_connections%'; 查看当前的mysql链接值 ...
spoj5973
SP5973 SELTEAM - Selecting Teams #include <bits/stdc++.h> using namespace std; typedef long lo ...
Django基础之Session版登录验证
from functools import wraps def check_login(func): @wraps(func) def inner(request, *args, **kwargs): ...
图论——Floyd算法拓展及其动规本质
一.Floyd算法本质首先,关于Floyd算法: Floyd-Warshall算法是一种在具有正或负边缘权重(但没有负周期)的加权图中找到最短路径的算法.算法的单个执行将找到所有顶点对之间的最短路径 ...
maven上传jar包(oracle jdbc驱动)
由于Oracle授权问题,Maven3不提供Oracle JDBC driver,为了在Maven项目中应用Oracle JDBC driver,必须手动添加到本地仓库.一.首先要得到Oracle J ...
spring boot通过自定义注解和AOP拦截指定的请求
一准备工作 1.1 添加依赖通过spring boot创建好工程后,添加如下依赖,不然工程中无法使用切面的注解,就无法对制定的方法进行拦截 <dependency> <group ...
python 查看源代码
使用包inspect import inspect from mxnet import contrib 查看模块所在路径: inspect.getsourcefile(contrib) 查看源码: i ...
WordPress窗体化侧边栏
窗体化侧边栏是一个支持 Widget 的侧边栏或者说是窗体化(widgetized)的侧边栏几乎是 WordPress 主题的标准. 首先,什么是窗体化(widgetizing)呢?简单的说,窗体化就 ...

SGI STL源码stl_vector.h分析

前言