C++中的迭代器和指针

在前面的内容中我们简单讲过,STL主要是由三部分组成

  1. 容器(container),包括vector,list,set,map等
  2. 泛型算法(generic algorithm),用来操作这些容器,包括find(),sort(),replace()等
  3. 迭代器(iterator),泛型算法操作容器的工具,是连接容器和算法的粘合剂

一、迭代器(iterator)

在介绍STL之前,首先了解一下什么是迭代器。STL中的泛型算法提供了很多可作用于容器类以及数组类上的操作,这些算法与他们想要操作的元素类型无关(int,double,string等)且与容器类独立(vector,list,array等)。很容易想到,泛型算法通过函数模板(function template)技术来达到 “与操作对象的元素类型无关” 的目的,而实现与 “容器无关” 则不直接在容器本身进行操作,而是借助一对 iterator 来标示我们要进行迭代的元素范围。我们通过一个具体的问题来引入 iterator 的设计动机。

问题描述:

给定一个存储整数的vector,如果vector内存在目标值value,就返回指向该值的指针;否则返回0。

首先很容易想到的一种做法是:

int* find(vector<int>& nums, const int& value){
for(int i=0; i<nums.size(); i++){
if(nums[i]==value) return &nums[i];
}
return 0;
}

接下来我们使用函数模板技术来扩充这个函数的功能,使其能够处理不同类型的数据类型:

template <typename T>
T* find(vector<T>& nums, const T& value){
for(int i=0; i<nums.size(); i++){
if(nums[i]==value) return &nums[i];
}
return 0;
}

紧接着我们会想,函数能不能同时实现对vector和array类型的输入进行查找,一种解决办法是通过函数重载的技术来实现,但是如果要实现很多种类型的容器,那么便需要写很多个重载函数。另一种更好的解决办法是:我们便不将容器本身作为参数传入,而是传入需要处理的数据的开始和结束位置,这样便对任意的输入有了普遍性。

对于 array 数组类型的数据 int array[10]而言,array=&arran[0] 即数组名就代表数组的开始地址,也代表数组第一个元素的地址。由于在传递时,无论是 array[10],array[24],都不会传递 array 的结束地址,因此需要额外传递一个参数 size,或者一个结尾地址,那么程序便可以写成:

方法一:传递数组的大小作为参数来标示结束为止
template <typename T>
T* find(const T* array, int size, const T& value){...}
方法二:传递数组的结尾指针来标示结束为止
template <typename T>
T* find(const T* begin, const T* end, const T& value){...}

上面我们已经完成了 array 类型输入的find 函数的编写,下面我们就来简单看一下调用方式:

int 	in_array[5] = {1, 4, 5, 7, 2};
double do_array[7] = {1.5, 2.7, 3.2, 4, 7, 2, 1.7};
int* f1 = find(array, 5, 4); //采用第一种调用方式,传入开始位置和数组大小
int* f2 = find(do_array, do_array+7, 2); //采用第二种调用方式,传入开始位置和结束位置即[开始位置,结束位置)

那么针对 vector 类型的容器,它的存储方式跟 array 相同,都是以一块连续的内存存储所有元素,因此可以采用跟 array 相同的方式来实现 find 函数。但是二者不同的是:vector 容器可以为空而 array 不能为空,因此:

vector<int> nums;	find(&nums[0], &nums[0+n], value);	//正确
int array[]; //无法对 array[0] 取地址

所以为了避免每次在计算 array 的首地址时,array 为空的情况,抽象出一个新的函数 begin(),具体定义如下:

template <typename T>
inline T* begin(const vector<T>& vec){
return vec.empty() ? 0:&vec[0];
}

我们以同样的方式封装成 end() 函数,返回 vector 的结束地址。因此我们便有了放之四海而皆准的调用方式:

find( begin(vec), end(vec), value ); // 开始地址,结束地址,查找值

再进一步,我们可以尝试将 find 函数应用在所有的容器类型,但是由于大部分容器(比如:list,map,set)并不是顺序存储,因此 vectorarray 的这种指针寻址的方式并不适合其他非连续内存空间存储的容器类型。解决这个问题的方法是,在底层指针的行为之上提供一层抽象,取代程序原本的 “指针直接操作” 方式。我们把底层指针的处理全部放在此抽象层中,将原本的指针操作根据具体的容器类型进行重载,这样我们便可以处理标准库所提供的的所有容器类,这便是 iterator 的创建原因。iterator 的操作方式跟指针一样,但是 iterator 的 ++, !=, * 等运算符是根据具体的容器类型重载过得。对 list 而言,++ 会按照链表的方式前进到下一个元素,对 vector 而言,++ 会直接指向下一个内存位置。

既然知道了迭代器的实现原理,那么下面我们来简单实现一下 `list` 的迭代器:

/*************定义单链表的类************/
template<typename T>
class node {
public:
T value;
node *next;
node() : next(nullptr) {}
node(T val, node *p = nullptr) : value(val), next(p) {}
};
/*************封装单链表***************/
template<typename T>
class my_list {
private:
node<T> *head;
node<T> *tail;
int size;
private:
//单链表迭代器的实现
class list_iterator {
private:
node<T> *ptr; //指向list容器中的某个元素的指针
public:
list_iterator(node<T> *p = nullptr) : ptr(p) {}
//重载++、--、*、->等基本操作
//返回引用,方便通过*it来修改对象
T &operator*() const {
return ptr->value;
}
node<T> *operator->() const {
return ptr;
}
list_iterator &operator++() {
ptr = ptr->next;
return *this;
}
list_iterator operator++(int) {
node<T> *tmp = ptr;
// this 是指向list_iterator的常量指针,因此*this就是list_iterator对象,前置++已经被重载过
++(*this);
return list_iterator(tmp);
}
bool operator==(const list_iterator &t) const {
return t.ptr == this->ptr;
}
bool operator!=(const list_iterator &t) const {
return t.ptr != this->ptr;
}
}; public:
typedef list_iterator iterator; //类型别名
my_list() {
head = nullptr;
tail = nullptr;
size = 0;
}
//从链表尾部插入元素
void push_back(const T &value) {
if (head == nullptr) {
head = new node<T>(value);
tail = head;
} else {
tail->next = new node<T>(value);
tail = tail->next;
}
size++;
}
//打印链表元素
void print(std::ostream &os = std::cout) const {
for (node<T> *ptr = head; ptr != tail->next; ptr = ptr->next)
os << ptr->value << std::endl;
}
public:
//操作迭代器的方法
//返回链表头部指针
iterator begin() const {
return list_iterator(head);
}
//返回链表尾部指针
iterator end() const {
return list_iterator(tail->next);
}
//其它成员函数 insert/erase/emplace
};

二、容器(container):物之所置也

2.1 顺序性容器

  1. vector 以一块连续的内存来存放元素,对 vector 进行随机访问很有效率,但是由于 vector 的每个元素都被存储在距离起始点的固定偏移位置,如果将元素插在任意位置,那么效率很低。同理,删除任意位置的元素也缺乏效率;
  2. list 以双向链接而非连续内存来存储内容,因此实现 list 内部任意位置的插入和删除操作效率很高,但是如果要对 list 进行随机访问,则效率很低;
  3. deque 与 vector 一样都是使用连续内存来存放元素,deque 在最前端插入元素,最后端删除元素。

2.2 关联容器

map:被定义为一对(key-value)数值,其中的 key 通常是个字符串,扮演索引的角色,另一个数值是 valuevaluekey 通过映射函数 f 得到的值,可以记录 key 出现的次数等。map 对象中 keyfirst 对象来表示,valuesecond 对象来表示,即:

map<string, int>::iterator it = words.begin();
while(it != words.end()){
cout << "key:" << it->first << "\nvalue:" << it->second << endl;
}

查询map是否存在 key 有三种方法:

/**********************方法一**********************/
string target="a";
int count = words[target]; // 查询words中是否存在 "a"
/**********************方法二**********************/
string target="a";
map<string, int>::iterator it = words.find(target);
/**********************方法三**********************/
string target="a";
int count = words.count(target);

其中:

  1. 方法一:如果 words 中存在 "a",count 中就记录了 "a" 的个数。**但是,当 words 中本来就不含有 "a" 时,该方法会通过 words[target] 自动添加进 words,此时 words[target]=0 **,因此该方法不建议用在查询中;
  2. 方法二:类似于上一节中写的 find 函数,当找到该元素时,返回指向该元素的迭代器,否则返回指向最有一个元素的后一个位置的迭代器 words.end()。所以通过判断函数返回值是否为 words.end() 便可以知道结果;
  3. 方法三:count 会返回某个特定项在 map 内的个数。

set:set的操作方式跟map差不多,set中相当于只记录了 key 值。

无论是 map 还是 set,在进行插入元素后会对其中的元素进行排序,因此当不需要排序时,需要定义:

unordered_map<pair<type1, type2>>my_map;
unordered_set<pair<type1, type2>>my_set;

2.3 所有容器的共通操作

  1. ==, != :返回 true 或者 false, 判断是否相等;
  2. empty():在容器为空时返回 true,否则返回 false
  3. size():返回容器内的元素个数;
  4. clear():清空容器内的元素,但是保留容器的长度;
  5. begin():返回容器第一个元素的 iterator
  6. end():返回容器最后一个元素的后一个位置的 iterator
  7. insert():在容器的指定位置插入元素;
  8. erase():在容器的指定位置删除元素;
  9. push_back():在容器的末端插入元素;
  10. pop_back():在容器的首端取出元素.......

上面列举的都是比较常见的一部分,由于精力有限难免有错误和疏漏,欢迎大家在阅读的同时对文中的不当之处进行指正、补充,不胜感激 !

三、参考内容

  1. 《Essential C++》中文版,侯捷译
  2. https://www.cnblogs.com/wengle520/p/12492708.html

谈谈 C++ STL 中的迭代器的更多相关文章

  1. STL 中 使用迭代器删除元素的问题

    在vector中删除,大家都知道,直接erase的话,这种写法很有问题.因为erase(iter)之后iter指针就变成野指针了,此时继续iter++就会出问题. for(auto iter = v. ...

  2. STL中的迭代器分类

      STL中迭代器的分类 五类迭代器如下: 1.输入迭代器:只读,一次传递    为输入迭代器预定义实现只有istream_iterator和istreambuf_iterator,用于从一个输入流i ...

  3. STL中,迭代器的分类

    五类迭代器如下: 1.输入迭代器:只读,一次传递    为输入迭代器预定义实现只有istream_iterator和istreambuf_iterator,用于从一个输入流istream中读取.一个输 ...

  4. STL中的迭代器的使用

    package com.text; import java.lang.reflect.Field;import java.util.ArrayList;import java.util.Iterato ...

  5. C++中的迭代器

    C++STL中的迭代器 "指针"对所有C/C++的程序员来说,一点都不陌生.在接触到C语言中的malloc函数和C++中的new函数后,我们也知道这两个函数返回的都是一个指针,该指 ...

  6. C++ STL中迭代器失效的问题

    my_container.erase(iter); 其中my_container是STL的某种容器,iter是指向这个容器中某个元素的迭代器.如果不是在for,while循环中,这种方式删除元素没有问 ...

  7. C++ STL中vector(向量容器)使用简单介绍

    原文:http://www.seacha.com/article.php/knowledge/cbase/2013/0903/2205.html C++ vector(向量容器)是一个线性顺序结构.相 ...

  8. C++ STL中的常用容器浅谈

    STL是C/C++开发中一个非常重要的模板,而其中定义的各种容器也是非常方便我们大家使用.下面,我们就浅谈某些常用的容器.这里我们不涉及容器的基本操作之类,只是要讨论一下各个容器其各自的特点.STL中 ...

  9. 适配器模式—STL中的适配器模式分析

    适配器模式通常用于将一个类的接口转换为客户需要的另外一个接口,通过使用Adapter模式能够使得原本接口不兼容而不能一起工作的类可以一起工作. 这里将通过分析c++的标准模板库(STL)中的适配器来学 ...

随机推荐

  1. Reactive Spring实战 -- 响应式Kafka交互

    本文分享如何使用KRaft部署Kafka集群,以及Spring中如何实现Kafka响应式交互. KRaft 我们知道,Kafka使用Zookeeper负责为kafka存储broker,Consumer ...

  2. Java行为参数化的演进

    首先感谢<java8实战>一书作者某某某. 需求场景: 为一位果农设计一款软件,可以根据果农的需求筛选出相应的水果. 例如: 根据颜色筛选 根据重量筛选 根据颜色和重量筛选 准备工作 定义 ...

  3. 去除office自动生成目录后生成的小框框(内容控件,目录控件)

    如何自动生成目录在这里就不进行阐述了,想必能看到这这里的人已经完成了目录的自动生成,那我就来直接演示如何去除自动生成目录后烦人的目录内容控件吧 直接上图片

  4. 与KubernetesAPI服务器交互

    在介绍过的Downward API提供了一种简单的方式,将pod和容器的元数据传递给在它们内部运行的进程.但这种方式其实仅仅可以暴露一个pod自身的元数据,而且只可以暴露部分元数据.某些情况下,应用需 ...

  5. Kubernetes网络的iptables模式和ipvs模式支持ping分析

    1.iptables模式无法ping通原因分析 iptables模式下,无法ping通任何svc,包括clusterip.所有ns下,下面来分析原因: 查看kubernetes的网络模式 curl 1 ...

  6. Elasticsearch中的Term查询和全文查询

    目录 前言 Term 查询 exists 查询 fuzzy 查询 ids 查询 prefix 查询 range 查询 regexp 查询 term 查询 terms 查询 terms_set 查询 t ...

  7. 15.3、mysql之InnoDB和MyISAM表空间详解

    15.3.1.InnoDB引擎表空间: 1.表空间分类: 共享表空间: 某一个数据库的所有的表数据,索引文件全部放在一个文件中,默认这个共享表空间的文件路径在 data目录下. 默认的文件名为:ibd ...

  8. 『动善时』JMeter基础 — 53、JMeter集合点功能的使用

    目录 1.集合点介绍 2.同步定时器界面介绍 3.集合点的使用 (1)测试计划内包含的元件 (2)线程组元件内容 (3)HTTP请求组件内容 (4)同步定时器内容 (5)运行脚本查看结果 4.集合点设 ...

  9. CRM企业管理系统对于企业的价值

    对于企业来说,一个完整的工作流程可以概括为三个阶段:售前.售中.售后.每个阶段都需要不同的管理.此外,客户关系管理客户关系管理系统可以帮助企业在这三个阶段进行业务管理和客户管理,帮助企业更好地运作,增 ...

  10. Docker:docker部署Tomcat运行web项目

    查找Docker Hub上的tomcat镜像 docker search tomcat 拉取官方的镜像 docker pull tomcat 启动Tomcat服务 方式1: 通过dockerfile生 ...