大家好,我是小贺。

点赞再看,养成习惯

文章每周持续更新,可以微信搜索「herongwei」第一时间阅读和催更,本文 GitHub : https://github.com/rongweihe/MoreThanCPlusPlus 已经收录,有一线大厂面试点思维导图,也整理了很多我的文档,欢迎 star 和完善。一起加油,变得更好!

前言

上一篇,我们剖析了 STL 空间配置器,这一篇文章,我们来学习下 STL 迭代器以及背后的 traits 编程技法。

在 STL 编程中,容器和算法是独立设计的,容器里面存的是数据,而算法则是提供了对数据的操作,在算法操作数据的过程中,要用到迭代器,迭代器可以看做是容器和算法中间的桥梁。

1、迭代器设计模式

为何说迭代器的时候,还谈到了设计模式?这个迭代器和设计模式又有什么关系呢?

其实,在《设计模式:可复用面向对象软件的基础》(GOF)这本经典书中,谈到了 23 种设计模式,其中就有 iterator 迭代模式,且篇幅颇大。

碰巧,笔者在研究 STL 源码的时候,同样的发现有 iterator 迭代器,而且还占据了一章的篇幅。

在设计模式中,关于 iterator 的描述如下:一种能够顺序访问容器中每个元素的方法,使用该方法不能暴露容器内部的表达方式。而类型萃取技术就是为了要解决和 iterator 有关的问题的。

有了上面这个基础,我们就知道了迭代器本身也是一种设计模式,其设计思想值得我们仔细体会。

那么 C++ STL 实现 iterator 和 GOF 介绍的迭代器实现方法什么区别呢? 那首先我们需要了解 C++ 中的两个编程范式的概念,OOP(面向对象编程)和 GP(泛型编程)。

在 C++ 语言里面,我们可用以下方式来简单区分一下 OOP 和 GP :

OOP:将 methods 和 datas 关联到一起 (通俗点就是方法和成员变量放到一个类中实现),通过继承的方式,利用虚函数表(virtual)来实现运行时类型的判定,也叫"动态多态",由于运行过程中需根据类型去检索虚函数表,因此效率相对较低。

GP:泛型编程,也被称为"静态多态",多种数据类型在同一种算法或者结构上皆可操作,其效率与针对某特定数据类型而设计的算法或者结构相同, 具体数据类型在编译期确定,编译器承担更多,代码执行效率高。在 STL 中利用 GP 将 methods 和 datas 实现了分而治之。

而 C++ STL 库的整个实现采用的就是 GP(Generic Programming),而不是 OOP(Object Oriented Programming)。而 GOF 设计模式采用的就是继承关系实现的,因此,相对来讲,C++ STL 的实现效率会相对较高,而且也更有利于维护。

在 STL 编程结构里面,迭代器其实也是一种模板 class ,迭代器在 STL 中得到了广泛的应用,通过迭代器,容器和算法可以有机的绑定在一起,只要对算法给予不同的迭代器,比如 vector::iterator、list::iterator,std::find() 就能对不同的容器进行查找,而无需针对某个容器来设计多个版本。

这样看来,迭代器似乎依附在容器之下,那么,有没有独立而适用于所有容器的泛化的迭代器呢?这个问题先留着,在后面我们会看到,在 STL 编程结构里面,它是如何把迭代器运用的炉火纯青。

2、智能指针

STL 是泛型编程思想的产物,是以泛型编程为指导而产生的。具体来说,STL 中的迭代器将范型算法 (find, count, find_if) 等应用于某个容器中,给算法提供一个访问容器元素的工具,iterator 就扮演着这个重要的角色。

稍微看过 STL 迭代器源码的,就明白迭代器其实也是一种智能指针,因此,它也就拥有了一般指针的所有特点—— 能够对其进行 * -> 操作。

  1. template<typename T>
  2. class ListIterator {//mylist迭代器
  3. public:
  4. ListIterator(T *p = 0) : m_ptr(p){} //构造函数
  5. T& operator*() const { return *m_ptr;} //取值,即dereference
  6. T* operator->() const { return m_ptr;} //成员访问,即member access
  7. //...
  8. };

但是在遍历容器的时候,不可避免的要对遍历的容器内部有所了解,所以,干脆把迭代器的开发工作交给容器的设计者,如此以来,所有实现细节反而得以封装起来不被使用者看到,这也正是为什么每一种 STL 容器都提供有专属迭代器的缘故。

比如笔者自己实现的 list 迭代器在这里使用的好处主要有:

  • (1) 不用担心内存泄漏(类似智能指针,析构函数释放内存);
  • (2) 对于 list ,取下一个元素不是通过自增而是通过 next 指针来取,使用智能指针可以对自增进行重载,从而提供统一接口

3、template 参数推导

参数推导能帮我们解决什么问题呢?

在算法中,你可能会定义一个简单的中间变量或者设定算法的返回变量类型,这时候,你可能会遇到这样的问题,假如你需要知道迭代器所指元素的类型是什么,进而获取这个迭代器操作的算法的返回类型,但是问题是 C++ 没有 typeof 这类判断类型的函数,也无法直接获取,那该如何是好?

注意是类型,不是迭代器的值,虽然 C++ 提供了一个 typeid() 操作符,这个操作符只能获得型别的名称,但不能用来声明变量。要想获得迭代器型别,这个时候又该如何是好呢?

function template 的参数推导机制是一个不错的方法。

例如:

如果 I 是某个指向特定对象的指针,那么在 func 中需要指针所指向对象的型别的时候,怎么办呢?这个还比较容易,模板的参数推导机制可以完成任务,

  1. template <class I>
  2. inline void func(I iter) {
  3. func_imp(iter, *iter); // 传入 iter 和 iter 所指的值,class 自动推导
  4. }

通过模板的推导机制,就能轻而易举的获得指针所指向的对象的类型。

  1. template <class I, class T>
  2. void func_imp(I iter, T t) {
  3. T tmp; // 这里就是迭代器所指物的类别
  4. // ... 功能实现
  5. }
  6. int main() {
  7. int i;
  8. func(&i);//这里传入的是一个迭代器(原生指针也是一种迭代器)
  9. }



上面的做法呢,通过多层的迭代,很巧妙地导出了 T ,但是却很有局限性,比如,我希望 func() 返回迭代器的 value type 类型返回值, 函数的 "template 参数推导机制" 推导的只是参数,无法推导函数的返回值类型。万一需要推导函数的返回值,好像就不行了,那么又该如何是好?

这就引出了下面的内嵌型别。

4、声明内嵌型别

上述所说的 迭代器所指对象的型别,称之为迭代器的 value type

尽管在 func_impl 中我们可以把 T 作为函数的返回值,但是问题是用户需要调用的是 func

如果在参数推导机制上加上内嵌型别 (typedef) 呢?为指定的对象类型定义一个别名,然后直接获取,这样来看一下实现:

  1. template<typename T>
  2. class MyIter {
  3. public:
  4. typedef T value_type; //内嵌类型声明
  5. MyIter(T *p = 0) : m_ptr(p) {}
  6. T& operator*() const { return *m_ptr;}
  7. private:
  8. T *m_ptr;
  9. };
  10. //以迭代器所指对象的类型作为返回类型
  11. //注意typename是必须的,它告诉编译器这是一个类型
  12. template<typename MyIter>
  13. typename MyIter::value_type Func(MyIter iter) {
  14. return *iter;
  15. }
  16. int main(int argc, const char *argv[]) {
  17. MyIter<int> iter(new int(666));
  18. std::cout<<Func(iter)<<std::endl; //print=> 666
  19. }

上面的解决方案看着可行,但其实呢,实际上还是有问题,这里有一个隐晦的陷阱:实际上并不是所有的迭代器都是 class type ,原生指针也是一种迭代器,由于原生指针不是 class type ,所以没法为它定义内嵌型别

因为 func 如果是一个泛型算法,那么它也绝对要接受一个原生指针作为迭代器,下面的代码编译没法通过:

  1. int *p = new int(5);
  2. cout<<Func(p)<<endl; // error

要解决这个问题,Partial specialization (模板偏特化)就出场了。

5、Partial specialization(模板偏特化)

所谓偏特化是指如果一个 class template 拥有一个以上的 template 参数,我们可以针对其中某个(或多个,但不是全部)template 参数进行特化,比如下面这个例子:

  1. template <typename T>
  2. class C {...}; //此泛化版本的 T 可以是任何类型
  3. template <typename T>
  4. class C<T*> {...}; //特化版本,仅仅适用于 T 为“原生指针”的情况,是泛化版本的限制版

所谓特化,就是特殊情况特殊处理,第一个类为泛化版本,T 可以是任意类型,第二个类为特化版本,是第一个类的特殊情况,只针对原生指针。

5.1、原生指针怎么办?——特性 “萃取” traits

还记得前面说过的参数推导机制+内嵌型别机制获取型别有什么问题吗?问题就在于原生指针虽然是迭代器但不是class ,无法定义内嵌型别,而偏特化似乎可以解决这个问题。

有了上面的认识,我们再看看 STL 是如何应用的。STL 定义了下面的类模板,它专门用来“萃取”迭代器的特性,而value type 正是迭代器的特性之一:

traitsbits/stl_iterator_base_types.h 这个文件中:

  1. template<class _Tp>
  2. struct iterator_traits<_Tp*> {
  3. typedef ptrdiff_t difference_type;
  4. typedef typename _Tp::value_type value_type;
  5. typedef typename _Tp::pointer pointer;
  6. typedef typename _Tp::reference reference;
  7. typedef typename _Tp::iterator_category iterator_category;
  8. };
  1. template<typename Iterator>
  2. struct iterator_traits { //类型萃取机
  3. typedef typename Iterator::value_type value_type; //value_type 就是 Iterator 的类型型别
  4. }

加入萃取机前后的变化:

  1. template<typename Iterator> //萃取前
  2. typename Iterator::value_type func(Iterator iter) {
  3. return *iter;
  4. }
  5. //通过 iterator_traits 作用后的版本
  6. template<typename Iterator> //萃取后
  7. typename iterator_traits<Iterator>::value_type func(Iterator iter) {
  8. return *iter;
  9. }

看到这里也许你会问了,这个萃取前和萃取后的 typename :iterator_traits::value_typeIterator::value_type 看起来一样啊,为什么还要增加 iterator_traits 这一层封装,岂不是多此一举?

回想萃取之前的版本有什么缺陷:不支持原生指针。而通过萃取机的封装,我们可以通过类模板的特化来支持原生指针的版本!如此一来,无论是智能指针,还是原生指针,iterator_traits::value_type 都能起作用,这就解决了前面的问题。

  1. //iterator_traits的偏特化版本,针对迭代器是原生指针的情况
  2. template<typename T>
  3. struct iterator_traits<T*> {
  4. typedef T value_type;
  5. };

看到这里,我们不得不佩服的 STL 的设计者们,真·秒啊!我们用下面这张图来总结一下前面的流程:

5.2 、const 偏特化

通过偏特化添加一层中间转换的 traits 模板 class,能实现对原生指针和迭代器的支持,有的读者可能会继续追问:对于指向常数对象的指针又该怎么处理呢?比如下面的例子:

  1. iterator_traits<const int*>::value_type // 获得的 value_type 是 const int,而不是 int

const 变量只能初始化,而不能赋值(这两个概念必须区分清楚)。这将带来下面的问题:

  1. template<typename Iterator>
  2. typename iterator_traits<Iterator>::value_type func(Iterator iter) {
  3. typename iterator_traits<Iterator>::value_type tmp;
  4. tmp = *iter; // 编译 error
  5. }
  6. int val = 666 ;
  7. const int *p = &val;
  8. func(p); // 这时函数里对 tmp 的赋值都将是不允许的

那该如何是好呢?答案还是偏特化,来看实现:

  1. template<typename T>
  2. struct iterator_traits<const T*> { //特化const指针
  3. typedef T value_type; //得到T而不是const T
  4. }

6、traits编程技法总结

通过上面几节的介绍,我们知道,所谓的 traits 编程技法无非 就是增加一层中间的模板 class,以解决获取迭代器的型别中的原生指针问题。利用一个中间层 iterator_traits 固定了 func 的形式,使得重复的代码大量减少,唯一要做的就是稍稍特化一下 iterator_tartis 使其支持 pointerconst pointer

  1. #include <iostream>
  2. template <class T>
  3. struct MyIter {
  4. typedef T value_type; // 内嵌型别声明
  5. T* ptr;
  6. MyIter(T* p = 0) : ptr(p) {}
  7. T& operator*() const { return *ptr; }
  8. };
  9. // class type
  10. template <class T>
  11. struct my_iterator_traits {
  12. typedef typename T::value_type value_type;
  13. };
  14. // 偏特化 1
  15. template <class T>
  16. struct my_iterator_traits<T*> {
  17. typedef T value_type;
  18. };
  19. // 偏特化 2
  20. template <class T>
  21. struct my_iterator_traits<const T*> {
  22. typedef T value_type;
  23. };
  24. // 首先询问 iterator_traits<I>::value_type,如果传递的 I 为指针,则进入特化版本,iterator_traits 直接回答;如果传递进来的 I 为 class type,就去询问 T::value_type.
  25. template <class I>
  26. typename my_iterator_traits<I>::value_type Func(I ite) {
  27. std::cout << "normal version" << std::endl;
  28. return *ite;
  29. }
  30. int main(int argc, const char *argv[]) {
  31. MyIter<int> ite(new int(6));
  32. std::cout << Func(ite)<<std::endl;//print=> 6
  33. int *p = new int(7);
  34. std::cout<<Func(p)<<std::endl;//print=> 7
  35. const int k = 8;
  36. std::cout<<Func(&k)<<std::endl;//print=> 8
  37. }

上述的过程是首先询问 iterator_traits::value_type,如果传递的 I 为指针,则进入特化版本, iterator_traits 直接回答T;如果传递进来的 Iclass type ,就去询问 T::value_type

通俗的解释可以参照下图:

总结:核心知识点在于 模板参数推导机制+内嵌类型定义机制, 为了能处理原生指针这种特殊的迭代器,引入了偏特化机制traits 就像一台 “特性萃取机”,把迭代器放进去,就能榨取出迭代器的特性。

这种偏特化是针对可调用函数 func 的偏特化,想象一种极端情况,假如 func 有几百万行代码,那么如果不这样做的话,就会造成非常大的代码污染。同时增加了代码冗余。

7、迭代器的型别和种类

7.1 迭代器的型别

我们再来看看迭代器的型别,常见迭代器相应型别有 5 种:

  • value_type:迭代器所指对象的类型,原生指针也是一种迭代器,对于原生指针 int*,int 即为指针所指对象的类型,也就是所谓的 value_type 。

  • difference_type: 用来表示两个迭代器之间的距离,对于原生指针,STL 以 C++ 内建的 ptrdiff_t 作为原生指针的 difference_type。

  • reference_type: 是指迭代器所指对象的类型的引用,reference_type 一般用在迭代器的 * 运算符重载上,如果 value_type 是 T,那么对应的 reference_type 就是 T&;如果 value_type 是 const T,那么对应的reference_type 就是 const T&。

  • pointer_type: 就是相应的指针类型,对于指针来说,最常用的功能就是 operator* 和 operator-> 两个运算符。

  • iterator_category: 的作用是标识迭代器的移动特性和可以对迭代器执行的操作,从 iterator_category 上,可将迭代器分为 Input Iterator、Output Iterator、Forward Iterator、Bidirectional Iterator、Random Access Iterator 五类,这样分可以尽可能地提高效率。

    1. template<typename Category,
    2. typename T,
    3. typename Distance = ptrdiff_t,
    4. typename Pointer = T*,
    5. typename Reference = T&>
    6. struct iterator //迭代器的定义
    7. {
    8. typedef Category iterator_category;
    9. typedef T value_type;
    10. typedef Distance difference_type;
    11. typedef Pointer pointer;
    12. typedef Reference reference;
    13. };

iterator class 不包含任何成员变量,只有类型的定义,因此不会增加额外的负担。由于后面三个类型都有默认值,在继承它的时候,只需要提供前两个参数就可以了。这个类主要是用来继承的,在实现具体的迭代器时,可以继承上面的类,这样子就不会漏掉上面的 5 个型别了

对应的迭代器萃取机设计如下:

  1. tempalte<typename I>
  2. struct iterator_traits {//特性萃取机,萃取迭代器特性
  3. typedef typename I::iterator_category iterator_category;
  4. typedef typename I::value_type value_type;
  5. typedef typeanme I:difference_type difference_type;
  6. typedef typename I::pointer pointer;
  7. typedef typename I::reference reference;
  8. };
  9. //需要对型别为指针和 const 指针设计特化版本看

7.2、迭代器的分类

最后,我们来看看,迭代器型别 iterator_category 对应的迭代器类别,这个类别会限制迭代器的操作和移动特性。

除了原生指针以外,迭代器被分为五类:

  • Input Iterator: 此迭代器不允许修改所指的对象,是只读的。支持 ==、!=、++、*、-> 等操作。
  • Output Iterator:允许算法在这种迭代器所形成的区间上进行只写操作。支持 ++、* 等操作。
  • Forward Iterator:允许算法在这种迭代器所形成的区间上进行读写操作,但只能单向移动,每次只能移动一步。支持 Input Iterator 和 Output Iterator 的所有操作。
  • Bidirectional Iterator:允许算法在这种迭代器所形成的区间上进行读写操作,可双向移动,每次只能移动一步。支持 Forward Iterator 的所有操作,并另外支持 – 操作。
  • Random Access Iterator:包含指针的所有操作,可进行随机访问,随意移动指定的步数。支持前面四种 Iterator 的所有操作,并另外支持 [n] 操作符等操作。

那么,这里,小贺想问大家,为什么我们要对迭代器进行分类呢?迭代器在具体的容器里是到底如何运用的呢?这个问题就放到下一节在讲。

最最后,我们再来回顾一下六大组件的关系:

这六大组件的交互关系:container(容器) 通过 allocator(配置器) 取得数据储存空间,algorithm(算法)通过 iterator(迭代器)存取 container(容器) 内容,functor(仿函数) 可以协助 algorithm(算法) 完成不同的策略变化,adapter(配接器) 可以修饰或套接 functor(仿函数)。

参考文章:

8、结尾

如果觉得文章对你有帮助,欢迎分享给你的朋友,一键三连,谢谢各位。

我是 herongwei ,是男人,就对自己狠一点,祝大家工作愉快,我们下期见。

【STL 源码剖析】浅谈 STL 迭代器与 traits 编程技法的更多相关文章

  1. STL源码剖析--迭代器(转)

    一.为什么需要traits编程技术 前面说了很多关于traits的光荣事迹,但是却一直没有介绍traits究竟是个什么东西,究竟是用来干什么的?traits在英文解释中就是特性,下面将会引入trait ...

  2. 《STL源码剖析》学习之traits编程

    侯捷老师在<STL源码剖析>中说到:了解traits编程技术,就像获得“芝麻开门”的口诀一样,从此得以一窥STL源码的奥秘.如此一说,其重要性就不言而喻了.      之前已经介绍过迭代器 ...

  3. 0《STL源码剖析》简介

    STL源码剖析 ----侯捷 STL主要包括六个组件: 1.配置器:负责空间配置和管理. 2.迭代器:扮演容器和算法之前的胶合剂,所谓“泛型指针”. 3.容器:各种数据结构,如vector,list, ...

  4. STL源码剖析 迭代器(iterator)概念与编程技法(三)

    1 STL迭代器原理 1.1  迭代器(iterator)是一中检查容器内元素并遍历元素的数据类型,STL设计的精髓在于,把容器(Containers)和算法(Algorithms)分开,而迭代器(i ...

  5. STL"源码"剖析-重点知识总结

    STL是C++重要的组件之一,大学时看过<STL源码剖析>这本书,这几天复习了一下,总结出以下LZ认为比较重要的知识点,内容有点略多 :) 1.STL概述 STL提供六大组件,彼此可以组合 ...

  6. 【转载】STL"源码"剖析-重点知识总结

    原文:STL"源码"剖析-重点知识总结 STL是C++重要的组件之一,大学时看过<STL源码剖析>这本书,这几天复习了一下,总结出以下LZ认为比较重要的知识点,内容有点 ...

  7. (原创滴~)STL源码剖析读书总结1——GP和内存管理

    读完侯捷先生的<STL源码剖析>,感觉真如他本人所说的"庖丁解牛,恢恢乎游刃有余",STL底层的实现一览无余,给人一种自己的C++水平又提升了一个level的幻觉,呵呵 ...

  8. STL源码剖析读书笔记之vector

    STL源码剖析读书笔记之vector 1.vector概述 vector是一种序列式容器,我的理解是vector就像数组.但是数组有一个很大的问题就是当我们分配 一个一定大小的数组的时候,起初也许我们 ...

  9. STL"源码"剖析

    STL"源码"剖析-重点知识总结   STL是C++重要的组件之一,大学时看过<STL源码剖析>这本书,这几天复习了一下,总结出以下LZ认为比较重要的知识点,内容有点略 ...

随机推荐

  1. 冲刺随笔——Day_Ten

    这个作业属于哪个课程 软件工程 (福州大学至诚学院 - 计算机工程系) 这个作业要求在哪里 团队作业第五次--Alpha冲刺 这个作业的目标 团队进行Alpha冲刺 作业正文 正文 其他参考文献 无 ...

  2. 2020.11.30【NOIP提高A组】模拟赛反思

    90,rk42 T1 考试的时候觉得可以贪心,就每次找到最大的,然后以它为根去遍历每个子树,求出其最大值,然后删去这个点.一直持续直到边删完,时间复杂度\(O(n^2)\),然后想了想链的情况,没有打 ...

  3. PyQt(Python+Qt)学习随笔:containers容器部件GroupBox分组框介绍

    老猿Python博文目录 专栏:使用PyQt开发图形界面Python应用 老猿Python博客地址 1.主要属性 GroupBox分组框是一个对多个部件进行编组的框架容器,可以带有标题(title属性 ...

  4. 记一次UE4源码编译和游戏项目打包过程

    1.首先我们需要注册一个Epic账户,网址如下 http://api.unrealengine.com/CHN/GettingStarted/Installation/index.html#bookm ...

  5. 2、pytorch——Linear模型(最基础版,理解框架,背诵记忆)(调用nn.Modules模块)

    #define y = X @ w import torch from torch import nn #第一模块,数据初始化 n = 100 X = torch.rand(n,2) true_w = ...

  6. 【CSP-S 2019】树的重心(重心的性质)

    Description 给定一颗 \(n\) 个顶点的树 \(\text T\),共 \(n-1\) 次断边操作,每次将树分为两部分 \(\text T_1, \text T_2\),求: \[\su ...

  7. Power BI八年回望记

    本人从事BI,数据仓库领域相关工作15个年头,这15年目睹了这个方向从火爆到逐渐被大数据领域不断吞食.中间零散关注Power BI好长时间,也算目睹了它的成长. 那天在网络上搜索power bi,无意 ...

  8. 冰点文库下载器v3.2.13绿色版

    冰点文库下载器,免费下载文档工具,无需积分也无需登陆就能自由下载百度文库.豆丁网.丁香网.电器网.MBAlib智库.爱问文档.畅享.IT168.HP009.MAX.Book118.道客巴巴.金字塔医学 ...

  9. DVWA各等级sql注入

    sql全等级注入 level:low <?php if( isset( $_REQUEST[ 'Submit' ] ) ) { //判断submit是否存在 // Get input $id = ...

  10. oracle DG搭建

    Oracle DG 搭建1. 环境 OS IP hostname db_name DB_UNIQUE_NAME主库 RHEL 5.4 192.168.12.20 edgzrip1.oracle.com ...