学习笔记:STL
第一部分:(参考百度百科)
一、STL简介
STL(Standard Template Library,标准模板库)是惠普实验室开发的一系列软件的统称。它是由Alexander Stepanov、Meng Lee和David R Musser在惠普实验室工作时所开发出来
的。现在虽说它主要出现在C++中,但在被引入C++之前该技术就已经存在了很长的一段时间。
STL的代码从广义上讲分为三类:algorithm(算法)、container(容器)和iterator(迭代器),几乎所有的代码都采用了模板类和模版函数的方式,这相比于传统的由函数和类
组成的库来说提供了更好的代码重用机会。在C++标准中,STL被组织为下面的13个头文件:<algorithm>、<deque>、<functional>、<iterator>、<vector>、<list>、<map>、
<memory>、<numeric>、<queue>、<set>、<stack>和<utility>。
二、算法
大家都能取得的一个共识是函数库对数据类型的选择对其可重用性起着至关重要的作用。举例来说,一个求方根的函数,在使用浮点数作为其参数类型的情况下的可重用性肯定比
使用整型作为它的参数类性要高。而C++通过模板的机制允许推迟对某些类型的选择,直到真正想使用模板或者说对模板进行特化的时候,STL就利用了这一点提供了相当多的有用
算法。它是在一个有效的框架中完成这些算法的——你可以将所有的类型划分为少数的几类,然后就可以在模版的参数中使用一种类型替换掉同一种类中的其他类型。
STL提供了大约100个实现算法的模版函数,比如算法for_each将为指定序列中的每一个元素调用指定的函数,stable_sort以你所指定的规则对序列进行稳定性排序等等。这样一来
,只要我们熟悉了STL之后,许多代码可以被大大的化简,只需要通过调用一两个算法模板,就可以完成所需要的功能并大大地提升效率。
算法部分主要由头文件<algorithm>,<numeric>和<functional>组成。
<algorithm>是所有STL头文件中最大的一个(尽管它很好理解),它是由一大堆模版函数组成的,可以认为每个函数在很大程度上都是独立的,其中常用到的功能范围涉及到比较、交换、查找、遍历操作、复制、修改、移除、反转、排序、合并等等。
<numeric>体积很小,只包括几个在序列上面进行简单数学运算的模板函数,包括加法和乘法在序列上的一些操作。
<functional>中则定义了一些模板类,用以声明函数对象。
三、容器
在实际的开发过程中,数据结构本身的重要性不会逊于操作于数据结构的算法的重要性,当程序中存在着对时间要求很高的部分时,数据结构的选择就显得更加重要。
经典的数据结构数量有限,但是我们常常重复着一些为了实现向量、链表等结构而编写的代码,这些代码都十分相似,只是为了适应不同数据的变化而在细节上有所出入。STL容器
就为我们提供了这样的方便,它允许我们重复利用已有的实现构造自己的特定类型下的数据结构,通过设置一些模版类,STL容器对最常用的数据结构提供了支持,这些模板的参数
允许我们指定容器中元素的数据类型,可以将我们许多重复而乏味的工作简化。
容器部分主要由头文件<vector>,<list>,<deque>,<set>,<map>,<stack>和<queue>组成。对于常用的一些容器和容器适配器(可以看作由其它容器实现的容器),可以通过下表总结一下它们和相应头文件的对应关系。
向量(vector) 连续存储的元素<vector>
列表(list) 由节点组成的双向链表,每个结点包含着一个元素<list>
双队列(deque) 连续存储的指向不同元素的指针所组成的数组<deque>
集合(set) 由节点组成的红黑树,每个节点都包含着一个元素,节点之间以某种作用于元素对的谓词排列,没有两个不同的元素能够拥有相同的次序 <set>
多重集合(multiset) 允许存在两个次序相等的元素的集合 <set>
栈(stack) 后进先出的值的排列 <stack>
队列(queue) 先进先出的执的排列 <queue>
优先队列(priority_queue) 元素的次序是由作用于所存储的值对上的某种谓词决定的的一种队列 <queue>
映射(map) 由{键,值}对组成的集合,以某种作用于键对上的谓词排列 <map>
多重映射(multimap) 允许键对有相等的次序的映射 <map>
四、迭代器
下面要说的迭代器从作用上来说是最基本的部分,可是理解起来比前两者都要费力一些(至少笔者是这样)。软件设计有一个基本原则,所有的问题都可以通过引进一个间接层来
简化,这种简化在STL中就是用迭代器来完成的
。
概括来说,迭代器在STL中用来将算法和容器联系起来,起着一种黏和剂的作用。几乎STL提供的所有算法都是通过迭代器存取元素序列进行工作的,每一个容器都定义了其本身所专有的迭代器,用以存取容器中的元素。
迭代器部分主要由头文件<utility>,<iterator>和<memory>组成。
<utility>是一个很小的头文件,它包括了贯穿使用在STL中的几个模板的声明,
<iterator>中提供了迭代器使用的许多方法,而对于<memory>的描述则十分的困难,它以不同寻常的方式为容器中的元素分配存储空间,同时也为某些算法执行期间产生的临时对象提供机制,<memory>中的主要部分是模板类allocator,它负责产生所有容器中的默认分配器。
对于之前不太了解STL的读者来说,上面的文字只是十分概括地描述了一下STL的框架,对您理解STL的机制乃至使用STL所起到的帮助微乎甚微,这不光是因为深入STL需要对C++的高级应用有比较全面的了解,更因为STL的三个部分算法、容器和迭代器三部分是互相牵制或者说是紧密结合的。从概念上讲最基础的部分是迭代器,可是直接学习迭代器会遇到许多抽象枯燥和繁琐的细节,然而不真正理解迭代器又是无法直接进入另两部分的学习的(至少对剖析源码来说是这样)。可以说,适应STL处理问题的方法是需要花费一定的时间的,但是以此为代价,STL取得了一种十分可贵的独立性,它通过迭代器能在尽可能少地知道某种数据结构的情况下完成对这一结构的运算,所以下决心钻研STL的朋友们千万不要被一时的困难击倒。其实STL运用的模式相对统一,只要适应了它,从一个STL工具到另一个工具,都不会有什么大的变化。
编程效率,因此应该是“应用至上”的,对于源代码则不必深究。笔者则认为分析源代码和应用并不矛盾,通过分析源代码也能提高我们对其应用的理解,当然根据具体的目的也可以有不同的侧重。
第二部分:
向量(vector) <vector>
连续存储的元素<vector>
Vector<int>c;
c.back() 传回最后一个数据,不检查这个数据是否存在。
c.clear() 移除容器中所有数据。
c.empty() 判断容器是否为空。
c.front() 传回地一个数据。
c.pop_back() 删除最后一个数据。
c.push_back(elem) 在尾部加入一个数据。
c[i] 等同于 c.at(i);
列表(list) <list>
由节点组成的双向链表,每个结点包含着一个元素<list>
list<int> list1(1,2,3)
front()返回第一个元素的引用 int nRet =list1.front() // nRet = 1
back()返回最后一元素的引用 int nRet =list1.back() // nRet = 3
push_back()增加一元素到链表尾 list1.push_back(4) //list1(1,2,3,4)
push_front()增加一元素到链表头 list1.push_front(4) //list1(4,1,2,3)
pop_back()删除链表尾的一个元素 list1.pop_back() //list1(1,2)
pop_front()删除链表头的一元素 list1.pop_front() //list1(2,3)
clear()删除所有元素 list1.clear(); // list1空了,list1.size()=0
sort()对链表排序,默认升序(可自定义回调函数)
list对象L1(4,3,5,1,4) L1.sort();
//L1(1,3,4,4,5) L1.sort(greater<int>());
//L1(5,4,4,3,1)
insert()在指定位置插入一个或多个元素
list1.insert(++list1.begin(),9); // list1(1,9,2,3)
list1.insert(list1.begin(),2,9); // list1(9,9,1,2,3);
list1.insert(list1.begin(),list2.begin(),--list2.end());//list1(4,5,1,2,3);
swap()交换两个链表(两个重载)
list1.swap(list2); //list1(4,5,6) list2(1,2,3)
unique()删除相邻重复元素
L1(1,1,4,3,5,1)
L1.unique();// L1(1,4,3,5,1)
merge()合并两个有序链表并使之有序
// 升序list1.merge(list2); //list1(1,2,3,4,5,6) list2现为空
// 降序L1(3,2,1), L2(6,5,4)L1.merge(L2, greater<int>()); //list1(6,5,4,3,2,1) list2现为空
reverse()反转链表:list1.reverse(); //list1(3,2,1)
remove()删除链表中匹配值的元素(匹配元素全部删除)list对象L1(4,3,5,1,4)L1.remove(4); //L1(3,5,1);
empty()判断是否链表为空bool bRet =L1.empty(); //若L1为空,bRet = true,否则bRet = false。
rbegin()返回链表最后一元素的后向指针(reverse_iteratoror const)list<int>::reverse_iterator it = list1.rbegin(); //*it = 3
rend()返回链表第一元素的下一位置的后向指针list<int>::reverse_iteratorit = list1.rend(); // *(--riter) = 1
集合(set) <set>
由节点组成的红黑树,每个节点都包含着一个元素,节点之间以某种作用于元素对的谓词排列,没有两个不同的元素能够拥有相同的次序 <set>
set<type>: 以less<>为排序法则的set
set<type,op>: 以op为排序法则的set
struct op{
bool operator()(const rec&a,const rec&b){
return a.x<b.x||a.x==b.x&&a.y<b.y;
}
};
1.1 set::begin
功能:返回第一个元素的定位器(iterator)的地址。
set <char>::iterator cp;
ctr.insert('a');
ctr.insert('b');
cp=ctr.begin(); //定位到ctr 的开始位置
1.2 set::clear
功能:将一个set 容器的全部元素删除。
1.3 set::count
功能:返回对应某个关键字的元素的个数。好像都是1吧
1.4 set::empty
功能:测试一个set 容器是否为空。
1.5 set::end
功能:返回最后一个元素后面的定位器(iterator)的地址。
1.7 set::erase
功能:将一个或一定范围的元素删除。
1.8 set::find
功能:求出与给定的关键字相等的元素的定位器。
set <string> ctr;
ctr.insert("abc");
ctr.insert("abcd");
ctr.insert("abcf");
set <string>::iterator cp;
cp=ctr.find("abc"); //查找key=1 的元素
if(cp!=ctr.end())
cout<<*cp <<endl;//显示abc
cp=ctr.find("adf"); //查找key=2 的元素
if(cp!=ctr.end())
cout<<*cp <<endl;//不显示
cp=ctr.find("gfv"); //查找key=3 的元素
if(cp!=ctr.end())
cout<<*cp <<endl;// 不显示
1.10 set::insert
功能:将一个元素或者一定数量的元素插入到set 的特定位置中。
1.25 set::upper_bound
功能:求出指向第一个关键字的值是大于一个给定值的元素的定位器。
cp=ctr.upper_bound(2);//输出比2大的最小元素
多重集合(multiset)< set>
允许存在两个次序相等的元素的集合 <set>
multiset<type>: 以less<>为排序法则的multiset
multiset<type, op>: 以op为排序法则的multise
struct op{
bool operator()(const rec&a,const rec&b){
return a.x<b.x||a.x==b.x&&a.y<b.y;
}
};
multiset<int>h;
__typeof(h.begin()) c=h.begin();//c指向h序列中第一个元素的地址,第一个元素是最小的元素
printf("%d ",*c);//将地址c存的数据输出
h.erase(c);//从h序列中将c指向的元素删除
__typeof()是个好东西~
栈(stack) <stack>
后进先出的值的排列 <stack>
定义一个stack的变量stack<int> s;
入栈,如例:s.push(x);
出栈,如例:s.pop();注意,出栈操作只是删除栈顶元素,并不返回该元素。
访问栈顶,如例:s.top()
判断栈空,如例:s.empty(),当栈空时,返回true。
访问栈中的元素个数,如例:s.size()
队列(queue) <queue>
先进先出的执的排列 <queue>
定义一个queue的变量 queue<Type> M
查看是否为空范例 M.empty() 是的话返回1,不是返回0;
从已有元素后面增加元素M.push()
输出现有元素的个数 M.size()
显示第一个元素 M.front()
显示最后一个元素 M.back()
清除第一个元素 M.pop()
优先队列(priority_queue) <queue>
元素的次序是由作用于所存储的值对上的某种谓词决定的的一种队列 <queue>
1、默认从大到小
priority_queue<int> qi;
2、从小到大输出可以传入一个比较函数,使用functional.h函数对象作为比较函数,great<int>(小到大) less<int>(大到小)
priority_queue<int, vector<int>, greater<int> >qi2; 第二个参数为容器类型。第三个参数为比较函数。
3、自定义:
struct cmp // 最小优先队列
{
bool operator()(const long long i,constlong long j)
{
return i>j;
}
};
priority_queue<int,vector<longlong>,cmp> Q;
struct node // 最小优先队列
{
int id,len;
bool operator < (const node &b)const// 只能重载小于号
{
return len>b.len;
}
};
priority_queue<node>Q;
Q.empty() // 判断队列是否为空返回ture表示空返回false表示空 bool
Q.top() // 返回顶端元素的值元素还在队列里
Q.pop() // 删除顶端元素 void
Q.push(V) // 把long long型的数V加入到队列里它会制动条件V的位置void
Q.size() // 返回队列里元素个数 unsigned int
双端队列(deque) <deque>
连续存储的指向不同元素的指针所组成的数组<deque>
deque<int>c
c.pop_back() 删除最后一个数据。
c.pop_front() 删除头部数据。
c.push_back(elem) 在尾部加入一个数据。
c.push_front(elem) 在头部插入一个数据。
c.clear() 移除容器中所有数据。
c.front() 传回地一个数据。
c.back() 传回最后一个数据,不检查这个数据是否存在。
c.size() 返回容器中实际数据的个数。
c.empty() 判断容器是否为空。
c[i] 等同于 c.at(i);
映射(map) 由{键,值}对组成的集合 <map>
以某种作用于键对上的谓词排列 <map>
三种插入数据的方法(第一种和第二种是一样的,当map中有这个关键字时,insert操作是插入不了数据的,用数组方式会覆盖以前该关键字对应的值)
1. map<int,string>mapStudent;
mapStudent.insert(pair<int,string>(1,"student_one"));
mapStudent.insert(pair<int,string>(2,"student_two"));
2. map<int,string>mapStudent;
mapStudent.insert(map<int,string>::value_type(1,"student_one"));
mapStudent.insert(map<int,string>::value_type(2,"student_two"));
3. map<int,string>mapStudent;
mapStudent[1]="student_one";
mapStudent[2]="student_two";
可以用pair来获得是否插入成功
map<int,string>mapStudent;
pair<map<int,string>::iterator,bool> insert_pair;
insert_pair=mapStudent.insert(pair<int,string>(1,"student_one"));
if(insert_pair.second==true)
cout<<"insert Successfully"<<endl;
怎么知道当前已经插入了多少数据呢,可以用size函数,用法如下:int nSize=mapStudent.size();
清空map中的数据可以用clear()函数,判定map中是否有数据可以用empty()函数
要判定一个数据(关键字)是否在map中出现的方法比较多,这里给出三种数据查找方法
第一种:用count函数来判定关键字是否出现,其缺点是无法定位数据出现位置,由于map的特性,一对一的映射关系,就决定了count函数的返回值只有两个,要么是0,要么是1,出现的情况,返回1
map<int,string> mapStudent;
mapStudent.insert(pair<int,string>(1,"student_one"));
mapStudent.insert(pair<int,string>(2,"student_two"));
mapStudent.insert(pair<int,string>(3,"student_three"));
int t1,t2;
t1=mapStudent.count(4);
t2=mapStudent.count(1);
第二种:用find函数来定位数据出现位置,它返回的一个迭代器,当数据出现时,它返回数据所在位置的迭代器
map<string,int>mapStudent;
mapStudent.insert(pair<string,int>("student_one",1));
mapStudent.insert(pair<string,int>("student_two",2));
mapStudent.insert(pair<string,int>("student_three",3));
map<string,int>::iteratoriter;
charch[]="student_three";
iter=mapStudent.find(ch);
if(iter!=mapStudent.end())
cout<<"Find,the value is: "<<iter->second<<endl;
else
cout<<"Donot Find"<<endl;
清空map中的数据可以用clear()函数,判定map中是否有数据可以用empty()函数,它返回true则说明是空
//如果要删除,用迭代器删除
map<int,string>::iterator iter;
iter=mapStudent.find(1);
mapStudent.erase(iter);
//如果要删除,用关键字删除
intn=mapStudent.erase(1);//如果删除了n会返回,否则返回
//用迭代器,成片的删除
mapStudent.erase(mapStudent.begin(),mapStudent.end());
//一下代码把整个map清空
mapStudent.erase(mapStudent.begin(),mapStudent.end());
排序
一、
#include <map>
#include <string>
using namespace std;
typedef struct tagStudentInfo
{
int nID;
string strName;
booloperator < (tagStudentInfo const& _A) const
{
//这个函数指定排序策略,按nID排序,如果nID相等的话,按strName排序
if(nID< _A.nID)
return true;
if(nID== _A.nID)
return strName.compare(_A.strName) < 0;
returnfalse;
}
}StudentInfo, *PStudentInfo; //学生信息
int main()
{
//用学生信息映射分数
map<StudentInfo, int>mapStudent;
StudentInfo studentInfo;
studentInfo.nID = 1;
studentInfo.strName ="student_one";
mapStudent.insert(pair<StudentInfo, int>(studentInfo, 90));
studentInfo.nID = 2;
studentInfo.strName ="student_two";
mapStudent.insert(pair<StudentInfo, int>(studentInfo, 80));
}
二、
#include <map>
#include <string>
#include <iostream>
using namespace std;
typedef struct tagStudentInfo
{
int nID;
string strName;
} StudentInfo, *PStudentInfo; //学生信息
struct sort
{
bool operator() (StudentInfo const &_A, StudentInfo const &_B)const
{
if(_A.nID < _B.nID)
return true;
if(_A.nID == _B.nID)
return _A.strName.compare(_B.strName) < 0;
return false;
}
};
int main()
{
//用学生信息映射分数
map<StudentInfo, int, sort>mapStudent;
StudentInfo studentInfo;
studentInfo.nID = 1;
studentInfo.strName = "student_one";
mapStudent.insert(pair<StudentInfo, int>(studentInfo, 90));
studentInfo.nID = 2;
studentInfo.strName = "student_two";
mapStudent.insert(pair<StudentInfo, int>(studentInfo, 80));
map<StudentInfo, int>::reverse_iterator iter;
for(iter=mapStudent.rbegin();iter!= mapStudent.rend();iter++)
cout<<iter->second<<endl;
}
多重映射(multimap) <map>
允许键对有相等的次序的映射 <map>
比如在电话簿中相同的人可以有两个以上电话号码,文件系统中可以将多个符号链接映射到相同的物理文件,或DNS服务器可以将几个URLs映射到相同的IP地址。
查找
1. 直接找到每种键值的所有元素的第一个元素的游标。
通过函数:lower_bound( const keytype& x ), upper_bound( const keytype&x ) 可以找到比指定键值x的小的键值的第一个元素和比指定键值x大的键值的第一个元素。返回值为该元素的游标。
细节:当到达键值x已经是最大时,upper_bound返回的是这个multimap的end游标。同理,当键值x已经是最小了,lower_bound返回的是这个multimap的begin游标。
2. 指定某个键值,进行遍历
可以使用上面的lower_bound和upper_bound函数进行游历,也可以使用函数equal_range。其返回的是一个游标对。游标
对pair::first是由函数lower_bound得到的x的前一个值,游标对pair::second的值是由函数upper_bound得到的
x的后一个值。
multimap<int,int>a;
a.insert(pair<int,int>(1,11));
a.insert(pair<int,int>(1,12));
a.insert(pair<int,int>(1,13));
a.insert(pair<int,int>(2,21));
a.insert(pair<int,int>(2,22));
a.insert(pair<int,int>(3,31));
a.insert(pair<int,int>(3,32));
multimap<int,int>::iterator p_map;
pair<multimap<int,int>::iterator,multimap<int,int>::iterator> ret;
for(p_map = a.begin() ; p_map != a.end();)
{
cout<<p_map->first<<" =>";
ret = a.equal_range(p_map->first);
for(p_map= ret.first; p_map != ret.second; ++p_map)
cout<<" "<< (*p_map).second;
cout<<endl;
}
下表转自:http://www.cnblogs.com/fangyukuan/archive/2010/09/21/1832675.html
Sequence containers |
Associative containers |
|
||||||||
Headers |
<vector> |
<deque> |
<list> |
<set> |
|
<bitset> |
||||
Members |
complex |
vector |
deque |
set |
multiset |
map |
multimap |
bitset |
||
constructor |
* |
constructor |
constructor |
constructor |
constructor |
constructor |
constructor |
constructor |
constructor |
|
destructor |
O(n) |
destructor |
destructor |
destructor |
destructor |
destructor |
destructor |
destructor |
||
operator= |
O(n) |
operator= |
operator= |
operator= |
operator= |
operator= |
operator= |
operator= |
operators |
|
iterators |
begin |
O(1) |
begin |
begin |
begin |
begin |
begin |
begin |
begin |
|
end |
O(1) |
end |
end |
end |
end |
end |
end |
end |
||
rbegin |
O(1) |
rbegin |
rbegin |
rbegin |
rbegin |
rbegin |
rbegin |
rbegin |
||
rend |
O(1) |
rend |
rend |
rend |
rend |
rend |
rend |
rend |
||
capacity |
size |
* |
size |
size |
size |
size |
size |
size |
size |
size |
max_size |
* |
max_size |
max_size |
max_size |
max_size |
max_size |
max_size |
max_size |
||
empty |
O(1) |
empty |
empty |
empty |
empty |
empty |
empty |
empty |
||
resize |
O(n) |
resize |
resize |
resize |
||||||
element access |
front |
O(1) |
front |
front |
front |
|||||
back |
O(1) |
back |
back |
back |
||||||
operator[] |
* |
operator[] |
operator[] |
operator[] |
operator[] |
|||||
at |
O(1) |
at |
at |
|||||||
modifiers |
assign |
O(n) |
assign |
assign |
assign |
|||||
insert |
* |
insert |
insert |
insert |
insert |
insert |
insert |
insert |
||
erase |
* |
erase |
erase |
erase |
erase |
erase |
erase |
erase |
||
swap |
O(1) |
swap |
swap |
swap |
swap |
swap |
swap |
swap |
||
clear |
O(n) |
clear |
clear |
clear |
clear |
clear |
clear |
clear |
||
push_front |
O(1) |
push_front |
push_front |
|||||||
pop_front |
O(1) |
pop_front |
pop_front |
|||||||
push_back |
O(1) |
push_back |
push_back |
push_back |
||||||
pop_back |
O(1) |
pop_back |
pop_back |
pop_back |
||||||
observers |
key_comp |
O(1) |
key_comp |
key_comp |
key_comp |
key_comp |
||||
value_comp |
O(1) |
value_comp |
value_comp |
value_comp |
value_comp |
|||||
operations |
find |
O(log n) |
find |
find |
find |
find |
||||
count |
O(log n) |
count |
count |
count |
count |
count |
||||
lower_bound |
O(log n) |
lower_bound |
lower_bound |
lower_bound |
lower_bound |
|||||
upper_bound |
O(log n) |
upper_bound |
upper_bound |
upper_bound |
upper_bound |
|||||
equal_range |
O(log n) |
equal_range |
equal_range |
equal_range |
equal_range |
|||||
unique members |
capacity |
splice |
set |
——————————————————————————————————————————————————————————
第1章 容器
第1条:慎重选择容器类型。
标准STL序列容器:vector、string、deque和list。
标准STL关联容器:set、multiset、map和multimap。
非标准序列容器slist和rope。slist是一个单向链表,rope本质上是一“重型”string。
非标准的关联容器hash_set、hase_multiset、hash_map和hash_multimap。
vector<char> 作为string的替代。(见第13条)
vector作为标准关联容器的替代。(见第23条)
几种标准的非STL容器,包括数组、bitset、valarray、stack、queue和priority_queue。
你是否关心容器中的元素是如何排序的?如果不关心,选择哈希容器.
容器中数据的布局是否需要和C兼容?如果需要兼容,就只能选择vector。(见第16条)
元素的查找速度是否是关键的考虑因素?如果是,就要考虑哈希容器、排序的vector和标准关联容器-或许这就是优先顺序。
对插入和删除操作,你需要事务语义吗?如果是,只能选择list。因为在标准容器中,只有list对多个元素的插入操作提供了事务语义。
deque是唯一的、迭代器可能会变为无效(插入操作仅在容器末尾发生时,deque的迭代器可能会变为无效)而指向数据的指针和引用依然有效的标准STL容器。
第2条:不要试图编写独立于容器类型的代码。
如果你想编写对大多数的容器都适用的代码,你只能使用它们的功能的交集。不同的容器是不同的,它们有非常明显的优缺点。它们并不是被设计用来交换使用的。
你无法编写独立于容器的代码,但是,它们(指客户代码)可能可以。
第3条:确保容器中的对象拷贝正确而高效。
copy in,copy out,是STL的工作方式,它总的设计思想是为了避免不必要的拷贝。使拷贝动作高效并且防止剥离问题发生的一个简单办法是使容器包含指针而不是对象。
第4条:调用empty而不是检查size()是否为0。
理由很简单:empty对所有的标准容器都是常数时间操作,而对一些list的实现,size耗费线性时间。
第5条:区间成员函数优先于与之对应的单元素成员函数。
区间成员函数写起来更容易,更能清楚地表达你的意图,而且它们表现出了更高的效率。
第6条:当心C++编译器最烦人的分析机制。
把形参加括号是合法的,把整个形参的声明(包括数据类型和形参名字)用括号括起来是非法的。
第7条:如果容器中包含了通过new操作创建的指针,切记在容器对象析构前将指针delete掉。
STL很智能,但没有智能到知道是否该删除自己所包含的指针所指向的对象的程度。为了避免资源泄漏,你必须在容器被析构前手工删除其中的每个指针,或使用引用计数形式的智能指针(比如Boost的sharedprt)代替指针。
第8条:切勿创建包含auto_ptr的容器对象。
拷贝一个auto_ptr意味着改变它的值。例如对一个包含auto_ptr的vector调用sort排序,结果是vector的几个元素被置为NULL而相应的元素被删除了。
第9条:慎重选择删除元素的方法。
要删除容器中指定值的所有对象:
如果容器是vector、string或deque,则使用erase-remove习惯用法。
SeqContainer<int> c;
c.erase(remove(c.begin(),c.end(),1963),c.end());
如果容器是list,则使用list::remove。
如果容器是一个标准关联容器,则使用它的erase成员函数。
要删除容器中满足特定条件的所有对象:
如果容器是vector、string或deque,则使用erase-remove_if习惯用法。
如果容器是list,则使用list::remove_if。
如果容器是一个标准关联容器,则使用remove_copy_if和swap,或者写一个循环遍历容器的元素,记住当把迭代器传给erase时,要对它进行后缀递增。
- AssocCOntainer<int> c;
- ...
- AssocContainer<int> goodValues;
- remove_copy_if(c.begin(), c.end(), inserter(goodValues, goodValues.end()),badValue);
- c.swap(goodValues);
- 或
- for(AssocContainer<int>::iterator i = c.begin();i !=c.end();/* do nothing */){
- if(badValue(*i)) c.erase(i++);
- else ++i;
- }
要在循环内部做某些(除了删除对象之外的)操作:
如果容器是一个标准序列容器,则写一个循环来遍历容器中的元素,记住每次掉用erase时,要用它的返回值更新迭代器。
如果容器是一个标准关联容器,则写一个循环来遍历容器中的元素,记住每次把迭代器传给erase时,要对迭代器做后缀递增。
第10条:了解分配子(allocator)的约定和限制。
第11条:理解自定义分配子的合理用法。
第12条:切勿对STL容器的线程安全性有不切实际的依赖。
对一个STL实现你最多只能期望:
多个线程读是安全的。
多个线程对不同的容器写入操作是安全的。
你不能期望STL库会把你从手工同步控制中解脱出来,而且你不能依赖于任何线程支持。
第2章 vector和string
第13条:vector和string优先于动态分配的数组。
如果用new,意味着你要确保后面进行了delete。
如果你所使用的string是以引用计数来实现的,而你又运行在多线程环境中,并认为string的引用计数实现会影响效率,那么你至少有三种可行的选择,而且,没有一种选择是舍弃STL。首先,检查你的库实现,看看是否可以禁用引用计数,通常是通过改变某个预处理变量的值。其次,寻找或开发一个不使用引用计数的string实现。第三,考虑使用vector<char>而不是string。vector的实现不允许使用引用计数,所以不会发生隐藏的多线程性能问题。
第14条:使用reserve来避免不必要的重新分配。
通常有两种方式来使用reserve以避免不必要的重新分配。第一种方式是,若能确切知道或大致预计容器中最终会有多少个元素,则此时可使用reserve。第二种方式是,先预留足够大的空间,然后,当把所有的数据都加入后,再去除多余的容量。
第15条:注意string实现的多样性。
如果你想有效的使用STL,那么你需要知道string实现的多样性,尤其是当你编写的代码必须要在不同的STL平台上运行而你又面临着严格的性能要求的时候。
第16条:了解如何把vector和string数据传给旧的API。
如果你有个vector v,而你需要得到一个只想v中的数据的指针,从而可把数据作为数组来对才,那么只需要使用&v[0]就可以了,也可以用&*v.begin(),但是不好理解。对于string
s,随应的形式是s.c_str()。
如果想用来自C API的数据来初始化一个vector,那么你可以利用vector和数组的内存布局兼容性,先把数据写入到vector中,然后把数据拷贝到期望最终写入的STL容器中。
第17条:使用“swap技巧”出去多余的容量。
vector<Contestant>(contestants).swap(contestants);
表达式vector<Contestant>(contestants)创建一个临时的矢量,它是contestants的拷贝:这是由 vector的拷贝构造函数来完成的。然而,vector的拷贝构造函数只为所拷贝的元素分配所需要的的内存,所以这个临时矢量没有多余的容量。然后我们把临时矢量中的数据和contestants中的数据作swap操作,在这之后,contestants具有了被去除之后的容量,即原先临时变量的容量,而临时变量的容量则变成了原先contestants臃肿的容量。到这时,临时矢量被析构,从而释放了先前为contestants所占据的内存。
同样的技巧对string也实用:
string s;
...
string(s).swap(s);
第18条:避免使用vector<bool>。
作为STL容器,vector<bool>只有两点不对。首先,它不是一个STL容器;其次,它并不存储bool。除此以外,一切正常。因此最好不要使用它,你可以用deque<bool>和bitset替代。vector<bool>来自一个雄心勃勃的试验,代理对象在C++软件开发中经常会很有用。C++标准委员会的人很清楚这一点,所以他们决定开发vector<bool>,以演示STL如果支持
“通过代理对象来存取其元素的的容器”。他们说,C++标准中有了这个例子,于是,人们在实现自己的基于代理的容器时就有了一个参考。然而他们却发现,要创建一个基于代理的容器,同时又要求它满足STL容器的所有要求是不可能的。由于种种原因,他们失败了的尝试被遗留在标准中。
第3章 关联容器
第19条:理解相等(equality)和等价(equivalence)的区别。
标准关联容器总是保持排列顺序的,所以每个容器必须有一个比较函数(默认为less)。等价的定义正是通过该比较函数而确定的。相等一定等价,等价不一定相等。
第20条:为包含指针的关联容器指定比较类型。
每当你创建包含指针的关联容器时,容器将会按照指针的值(就是内存地址)进行排序,绝大多数情况下,这不是你所希望的。
第21条:总是让比较函数在等值情况下返回false。
现在我给你演示一个很酷的现象。创建一个set,用less_equal作为它的比较类型,然后把10插入到该集合中:
- set<int, less_equal<int> > s; //s 用"<=" 来排序
- s.insert(10);
- s.insert(10);
- 对于第二个insert,集合会检查下面的表达式是否为真:
- !(10a <= 10b) && !(10b <= 10a); //检查10a和10b是否等价,结果是!(true) && !(true) 为false
结果集合中有两个10!
从技术上讲,用于对关联容器排序的比较函数必须为他们所比较的对象定义个“严格的弱序化”(strict weak ordering)。
第22条:切勿直接修改set或multiset中的键。
如果你不关心可移植性,而你想改变set或multiset中元素的值,并且你的STL实现(有的STL实现中,比如set<T>::
iterator 的operator*总是返回const
T&,就不能修改了)允许你这么做,则请继续做下去。只是注意不要改变元素中的键部分,即元素中能够影响容器有序性的部分。
如果你重视可移植性,就要确保set和multiset中的元素不能被修改。至少不能未经过强制类型转换(转换到一个引用类型const_cast<T&>)就修改。
如果你想以一种总是可行而且安全的方式来许该set、multiset、map和multimap中的元素,则可以分5个简单步骤来进行:
1. 找到你想修改的容器的元素。如果你不能肯定最好的做法,第45条介绍了如何执行一次恰当的搜索来找到特定的元素。
2. 为将要被修改的元素做一份拷贝,。在map和multimap的情况下,请记住,不要把该拷贝的第一个部分声明为const。毕竟,你想要改变它。
3. 修改该拷贝,使它具有你期望的值。
4. 把该元素从容器中删除,通常是通过erase来进行的(见第9条)。
5. 把拷贝插到容器中去。如果按照容器的排列顺序,新元素的位置可能与被删除元素的位置相同或紧邻,则使用“提示”(hint)形式的insert,以便把插入的效率从对数时间提高到常数时间。把你从第1步得来的迭代器作为提示信息。
第23条:考虑用排序的vector替代关联容器。
标
准关联容器通常被实现为平衡的二叉查找树。也就是说,它所适合的那些应用程序首先做一些插入操作,然后做查找,然后可能又插入一些元素,或许接着删掉一
些,随后又做查找,等等。这一系列时间的主要特征是插入、删除和超找混在一起。总的来说,没办法预测出针对这颗树的下一个操作是什么。
很多应用程序使用其数据结构的方式并不这么混乱。他们使用其数据结构的过程可以明显地分为三个阶段,总结如下:
1. 设置阶段。创建一个新的数据结构,并插入大量元素。在这个阶段,几乎所有的操作都是插入和删除操作。很少或几乎没有查找操作。
2. 查找操作。查询该数据结构以找到特定的信息。在这个阶段,几乎所有的操作都是查找操作,很少或几乎没有插入和删除操作。
3. 重组阶段。改变该数据结构的内容,或许是删除所有的当前数据,再插入新的数据。在行为上,这个阶段与第1阶段类似。当这个阶段结束以后,应用程序又回到第2阶段。
第24条:当效率至关重要时,请在map::operator[]与map::insert之间谨慎作出选择。
假定我们有一个Widget类,它支持默认构造函数,并根据一个double值来构造和赋值:
- class Widget{
- public:
- Widget();
- Widget(double weight);
- Widget& operator=(double weight);
- ...
- }
map 的operator[]函数与众不同。它与vector、deque和string的operator[]函数无关,与用于数组的内置operator
[]也没有关系。相反,map::operator[]的实际目的是为了提供“添加和更新”(add
or update)的功能。也就是说,对于下面的例子:
map<int, Widget> m;
m[1] = 1.50;
语句m[1] = 1.50相当于
typedef map<int, Widget> IntWidgetMap;
pair<INtWidgetMap::iterator, bool> result = m.insert(IntWidgetMap::value_type(1.Widget()));//用键值1和默认构造的值创建一个新的map条目
result.first->second = 1.50;//调用赋值构造函数
我们最好把对operator[]的调用换成对insert的直接调用:
m.insert(IntWidgetMap::value_type(1,1.50));
这里的效果和前面的代码相同,只是它通常会节省三个函数调用:一个用于创建默认构造的临时Widget对象,一个用于析构该临时对象,另一个是调用Widget的赋值操作符。
请看一下做更新操作时我们的选择:
m[k] = v; //使用operator[]把k的值更新为v
m.insert(IntWidgetMap::value_type(k,v)).first->second = v; //使用insert把k的值更新为v
insert调用需要一个IntWidgetMap::value_type类型的对象,所以当我们调用insert时,我们必须构造和西沟一个该类型的对象。这要付出一个pair构造函数和一个pair析构函数的代价。而这又会导致对Widget的构造和析构动作,因为pair<int,
Widget>本身又包含了一个Widget对象。而operator[]不使用pair对象,所以它不会构造和析构pair或Widget。
如果要更新一个已有的映射表元素,选择operator[];如果要添加一个新的元素,选择insert。
第25条:熟悉非标准的哈希容器。
标准C++库没有任何哈希容器,每个人认为这是一个遗憾,但是C++标准委员会认为,把它们加入到标准中所需的工作会拖延标准完成的时间。已经有决定要在标准的下一个版本中包含哈希容器。
第4章 迭代器
第26条:iterator优先于const_iterator、reverse_iterator以及const_reverse_iterator。
减少混用不同类型的迭代器的机会,尽量用iterator代替const_iterator。从const正确性的角度来看,仅仅为了避免一些可能存在的 STL实现缺陷而放弃使用const_iteraor显得有欠公允。但考虑到在容器类的某些成员函数中指定使用iterator的现状,得出 iterator较之const_iterator更为实用的结论也就不足为奇了。更何况,从实践的角度来看,并不总是值得卷入 const_iterator的麻烦中。
第27条:使用distance和advance将容器的const_iterator转换成iterator。
下面的代码试图把一个const_iterator强制转换为iterator:
typedef deque<int> IntDeque; //类型定义,简化代码
typedef IntDeque::iterator Iter;
typedeef IntDeque:;const_iterator ConstIter;
ConstIter ci; //ci 是一个const_iterator
...
Iter i(ci); //编译错误!从const_iterator 到 iterator没有隐式转换途径
Iter i(const_cast<Iter>(ci)); //仍然是编译错误!不能将const_iterator强制转换为iterator
包含显式类型转换的代码不能通过编译的原因在于,对于这些容器类型,iterator和const_iterator是完全不同的类,他们之间的关系甚至比string和complex<double>之间的关系还要远。
下面是这种方案的本质。
typedef deque<int> IntDeque; //类型定义,简化代码
typedef IntDeque::iterator Iter;
typedeef IntDeque:;const_iterator ConstIter;
IntDeque d;
ConstIter ci; //ci 是一个const_iterator
... //使ci指向d
Iter i(d.begin());//使i指向d的起始位置
advance(i,distance<ConstIter>(i,ci));//移动i,使它指向ci所指的位置
这中方法看上去非常简单和直接,也很令人吃惊。为了得到一个与const_iterator指向同一位置的iterator,首先创建一个新的 iterator,将它指向容器的起始位置,然后取得const_iterator距离容器起始位置的偏移量,并将iterator向前移动相同的偏移量即可。这项技术的效率取决于你所使用的迭代起,对于随机迭代器,它是常数时间的操作;对于双向迭代器,以及某些哈希容器,它是线性时间的操作。
第28条:正确理解由reverse_iterator的base()成员函数所产生的iterator的用法。
如果要在一个reverse_iterator ri指定的位置上插入元素,则只需在ri.base()位置处插入元素即可。对于插入操作而言,ri和ri.base()是等价的,ri.base()是真正与ri对应的iterator。
如果要在一个reverse_iterator ri指定的位置上删除一个元素,则需要在ri.base()前一个位置上执行删除操作。对于删除操作而言,ri和ri.base()是不等价的。
我们还是有必要来看一看执行这样一个删除操作的实际代码,其中暗藏着惊奇之处:
vector<int> v;
v.erase(--ri.base()); //试图删除ri.base()前面的元素,对于vector,往往编译通不过
对于vector和string,这段代码也许能工作,但对于vector和string的许多实现,它无法通过编译。这是因为在这样的实现中, iterator(和vconst_iterator)是以内置指针的方式实现的,所以ri.base()的结果是一个指针。C和C++都规定了从函数返回的指针不应该被修改,所以所以编译不能通过。
既然不能对base()的结果做递减操作,那么只要先递增reverse_iterator,然后再调用base()函数即可!
v.erase((++ri).base()); //删除ri所指的元素,这下编译没问题了!
第29条:对于逐个字符的输入请考虑使用istreambuf_iterator。
假如你想把一个文本文件的内容拷贝到一个string对象中,以下的代码看上去是一种合理的解决方案:
ifstream inputFile("interestingData.txt");
inputFIle.unsetf(ios::skipws);//istream_iterator使用operator>>函数来完成实际的读操作,而默认情况下operator>>函数会跳过空白字符
string fileData((istream_iterator<char> (inputFIle)),istream_iterator<char>());
然而,你可能会发现整个拷贝过程远不及你希望的那般快。istream_iterator内部使用的operator>>实际上执行了格式化的输入,但如果你只是想从输入流中读出下一个字符的话,它就显得有点多余了。
有一种更为有效的途径,那就是使用STL中最为神秘的法宝之一:istreambuf_iterator。istreambuf_iterator<char>对象使用方法与istream_iterator<char>大致相同,但是istreambuf_iterator<char>直接从流的缓冲区读取下一个字符。(更为特殊的是, istreambuf_iterator<char>对象从一个输入流istream
s中读取下一个字符的操作是通过s.rdbuf()->sgetc()来完成的。)
ifstream inputFile("interestingData.txt");
string fileData((istreambuf_iterator<char>(inputFile)),istreambuf_iterator<char>());
这次我们用不着清楚输入流的skipws标志,因为istreambuf_iterator不会跳过任何字符。
同样的,对于非格式化的逐个字符输出过程,你也应该考虑使用ostreambuf_iterator。
第5章 算法
第30条:确保目标区间足够大。
当程序员希望向容器中添加新的对象,这里有一个例子:
int transmogrify(int x); //该函数根据x生成一个新的值
vector<int> values;
vector<int> results;
transform(values.begin(),values.end(),back_inserter(results),transmogrify);
back_inserter返回的迭代起将使得push_back被调用,所以back_inserter可适用于所有提供了push_back方法的容器。同理,front_inserter仅适用于那些提供了push_front成员函数的容器(如deque和list)。
当是使用reserver提高一个序列插入操作的效率的时候,切记reserve只是增加了容器的容量,而容器的大小并未改变。当一个算法需要向 vector或者string中加入新的元素,即使已经调用了reserve,你也必须使用插入型的迭代器。如下代码给出了一种错误的方式:
vector<int> values;
vector<int> results;
...
results.reserve(results.size() + values.size());
transform(values.begin(), values.end(), results.end(), transmogrify);//变换的结果会写入到尚未初始化的内存,结果将是不确定的
在以上代码中transform欣然接受了在results尾部未初始化的内存中进行复制操作的任务。由于赋值操作重视在两个对象之间而不是在一个对象与一个未初始化的内存块之间进行,所以一般情况下,这段代码在运行时会失败。
假设希望transform覆盖results容器中已有的元素,那么就需要确保results中已有的元素至少和values中的元素一样多。否则,就必须使用resize来保证这一点。
- vector<int> values;
- vector<int> results;
- ...
- if(results.size() < values.size()){
- results.resize(values.size());
- }
- transform(values.begin(),values.end(),results.begin(),transmogrify);
- 或者,也可以先清空results,然后按通常的方式使用一个插入型迭代起:
- ...
- results.clear();
- results.reserve(values.size());
- transform(values.begin(),values.end(),back_inserter(results),transmogrify);
第31条:了解各种与排序有关的选择。
sort(stable_sort)、partial_sort和nth_element算法都要求随即访问迭代器,所以这些算法只能被应用于vector、string、deque和数组。partion(stable_partion)只要求双向迭代器就能完成工作。对于标准关联容器中的元素进行排序并没有实际意义,因为它们总是使用比较函数来维护内部元素的有效性。list是唯一需要排序却无法使用这些排序算法的容器,为此,list特别提供了sort成员函数(有趣的是,list::sort执行的是稳定排序)。如果希望希望一个list进行完全排序,可以用sort成员函数;但是,如果需要对list使用partial_sort或者nth_element算法的话,你就只能通过间接途径来完成了。一种间接做法是,将list中的元素拷贝到一个提供随即访问迭代器的容器中,然后对该容器执行你所期望的算法;另一种简介做法是,先创建一个list::iterator的容器,再对该容器执行相应的算法,然后通过其中的迭代器访问list的元素;第三中方法是利用一个包含迭代器的有序容器的信息,通过反复地调用splice成员函数,将 list中的元素调整到期望的目标位置。可以看到,你会有很多中选择。
第32条:如果确实需要删除元素,则需要在remove这一类算法之后调用erase。
1 2 3 99 5 99 7 8 9 99
调用remove(v.begin(),v.end(),99);后变成
1 2 3 5 7 8 9 8 9 99
remove无法从迭代器推知对应的容器类型,所以就无法调用容器的成员函数erase,因此就无法真正删除元素。其他两个算法remove_if和 unique也类似。不过list::remove和list::unique会真正删除元素(比用erase-remove和erase-unique 更为高效),这是STL中一个不一致的地方。
第33条:对包含指针的容器使用remove这一类算法时要特别小心。
无论你如何处理那些存放动态分配的指针的容器,你总是可以这样来进行:或者调用remove类算法之前先手工删除指针并将它们置为空,或者通过引用计数的智能指针( 如boost::shared_ptr),或者你自己发明的其他某项技术。
下面的代码利用第一种方式:
- void delAndNullifyUncertified(Widget*& pWidget)
- {
- if(!pWidget->isCertified())
- {
- delete pWidget;
- pWidget = 0;
- }
- }
- for_each(v.begin(),v.end(),delAndNullifyUndertified);
- v.erase(vemove(v.begin(),v.end(),static_cast<Widget*>(0)),v.end());
- 下面的的代码使用第二中方式:
- template<typename T> //RSCP = "Reference Counting Smart Pointer"
- class RCSP{...};
- tpedef RCSP<Widget> RCSPW;
- vector<RCSPW> v;
- ...
- v.push_back(RCSPW(new Widget));
- ...
- v.erase(remove_if(v.begin(),v.end(),not1(mem_fun(&Widget::isCertified))),v.end());
第34条:了解哪些算法要求使用排序的区间作为参数。
下面的代码要求排序的区间:
- binary_search lower_bound
- upper_bound equal_range
- set_union set_intersection
- set_difference set_symmetric_difference
- merge inplace_merge
- includes
- 下面的算法并不一定需要排序的区间:
- unique unique_copy
第35条:通过mismatch或lexicographical_compare实现简单的忽略大小写的字符串比较。
用mistatch实现:
//此函数判断两个字母是否相同,而忽略它们的大小写
- int ciCharCompare(char c1, char c2)
- {
- int lc1 = tolower(static_cast<unsigned_char>(c1));
- int lc2 = tolower(static_cast<unsigned_char>(c2));
- if(lc1 < lc2) return -1;
- if(lc1 > lc2) return 1;
- return 0;
- }
/* 此函数保证传递给ciStringCompareImpl的s1比s2短,如果s1和s2相同,返回0;如果s1比s2短,返回-1;如果s1比s2长,返回1。*/
int ciStringCompare(const string& s1, const string& s2)
{
if(s1.size() <= s2.size()) return ciStringCompareImpl(s1, s2);
else return – ciStringCompareImpl(s2, s1);
}
//如果s1和s2相同,返回0;如果s1比s2短,返回-1;如果s1和s2都是在非结尾处发生不匹配,有开始不匹配的那个字符决定。
- int ciStringCompareImpl(const string &s1, const string &c2)
- {
- typedef pair<string::const_iterator,string::const_iterator> PSCI;
- PSCI p = mismatch(s1.begin(),s1.end(),s2.begin(),not2(ptr_fun(ciCharCompare)));
- if(p.first == s1.end()){
- if(p.second == s2.end()) return 0;
- else return -1;
- }
- return ciCharCompair(*p.first, *p.second);
- }
用lexicographical_compare实现:
- bool ciCharLess(char c1, char c2)
- {
- return tolower(static_cast<unsigned char>(c1)) < tolower(static_cast<unsigned char>(c2));
- }
- bool ciStringCompare(const string &s1,const string &s2)
- {
- return lexicographical_compare(s1.begin(), s1.end(), s2.begin(), s2.end(), ciCharLess);
- }
第36条:理解copy_if算法的正确实现。
STL中没有copy_if的算法,下面是一个实现,但是不够完美:
- template<typename INputIterator,typename OUtputIterator,tpename Predicate>
- OutputIterator copy_if(INputIterator begin,INputIterator end,OutputIterator destBegin,Predicate p)
- {
- return remove_copy_if(begin,end,destBegin, not1(0));
- }
- copy_if(widgets.begin(), widgets.end(), ostream_iterator<Widget>(cerr, "\n"),isDefective);//编译错误
因为not1不能被直接应用到一个函数指针上(见41条),函数指针必须先用ptr_fun进行转换。为了调用copy_if的这个实现,你传入的不仅是一个函数对象,而且还应该是一个可配接(adaptable)的函数对象。虽然这很容易做到,但是要想成为STL算法,它不能给客户这样的负担。
下面是copy_if的正确实现:
- template<typename INputIterator,typename OUtputIterator,typename Predicate>
- OutputIterator copy_if(INputIterator begin,INputIterator end,OutputIterator destBegin,Predicate p)
- {
- while(begin != end){
- if(p(*begin)) *destBegin++ = *begin;
- ++begin;
- }
- return destBegin;
- }
第37条:使用accumulate或者for_each进行区间统计。
确保accumulate的返回类西和初始值类型相同。for_each返回的是一个函数对象。accumulate不允许副作用而for_each允许。(这是一个深层次的问题,也是一个涉及STL核心的问题,待解)
第6章 函数子、函数子类、函数及其他
第38条:遵循按值传递的原则来设计函数子类。
在STL中,
函数对象在函数之间来回传递的时候也是像函数指针那样按值传递的。因此,你的函数对象必须尽可能的小,否则拷贝的开销会很大;其次,函数对象必须是单态
的,也就是说,它们不得使用虚函数。这是因为,如果参数的类型是基类类型,而实参是派生类对象,那么在传递过程中会产生剥离问题(slicing
problem):在对象拷贝过程中,派生部分可能会被去掉,而仅保留了基类部分(见第3条)。
试图禁止多态的函数子同样也是不实际的。所以必须找到一种两全其美的办法,既允许函数对象可以很大并且/或保留多态性,又可以与STL所采用的按值传递函数子的习惯保持一致。这个办法就是:将所需要的数据和虚函数从函数子中分离出来,放到一个新的类中,然后在函数子中设一个指针,指向这个新类。
第39条:确保判别式是“纯函数”。
一个判别式(predicate)是一个返回值为bool类型的函数。一个纯函数(pure
function)是指返回值仅仅依赖于其参数的函数。
因为接受函数子的STL算法可能会先创建函数子对象的拷贝,然后使用这个拷贝,因此这一特性的直接反映就是判别式函数必须是纯函数。
- template<typename FwdIterator,typename Predicata>
- FwdIterator remove_if(FwdIterator begin, FwdIterator end, Predicate p)
- {
- begin = find_if(begin, end, p);//可能是p的拷贝
- if(begin == end return begin;
- else{
- FwdIterator next = begin;
- return remove_copy_if(++next, end, begin, p);//可能是p的另一个拷贝
- }
- }
第40条:若一个类是函数子,则应使它可配接。
4个标准的函数配接器(not1、not2、bind1st和bind2nd)都要求一些特殊的类型定义。提供了这些必要的类型定义(argument_type、first_argument_type、second_argument_type以及result_type)的函数对象被称为可配接的(adaptable)函数对象,反之,如果函数对象缺少这些类型定义,则称为不可配接的。可配接的函数对象能够与其他STL组件更为默契地协同工作。不过不同种类的函数子类所需要提供的类型定义也不尽相同,除非你要编写自定义的配接器,否则你并不需要知道有关这些类型定义的细节。这是因为,提供这些类型定义最简便的办法是让函数子从特定的基类继承,或者更准确的说,如果函数子类的operator()只有一个形参,那么它应该从 std::unary_function模板的一个实例继承;如果函数子类的operator()有两个形参,那么它应该从std::
binary_function继承。
对于unary_function,你必须指定函数子类operator()所带的参数的类型,以及返回类型;对于binary_function,你必须指定三个类型:operator()的第一个和第二个参数的类型,以及operator()的返回类型。以下是两个例子:
- template<typename T>
- class MeetsThreshold: public std::unary_function<Widget, bool> {
- private:
- const T threshold;
- public:
- MeetsThreshold(const T& threshold);
- bool operator()(const Widget&) const;
- ...
- };
- struct WidgetNameCompare:
- public std::binary_function<Widget, Widget, bool> {
- bool operator() (const Widget& lhs, const Widget& rhs) const;
- };
你可能已经注意到MeetsThreshold是一个类,而WidgetNameCompare是一个结构。这是因为MeetsThreshold包含了状态信息(数据成员threshold),而类是封装状态信息的一种逻辑方式;与此相反,WidgetNameCompare并不包含状态信息,因而不需要任何私有成员。如果一个函数子的所有成员都是公有的,那么通常会将其声明为结构而不是类。究竟是选择结构还是类来定义函数子纯属个人编码风格,但是如果你正在改进自己的编码风格,并希望自己的风格更加专业一点的话,你就应该注意到,STL中所有无状态的函数子类(如less<T>、 plus<T>等)一般都定义成结构。
我们在看一下WidgetNameCompare:
- struct WidgetNameCompare:
- public std::binary_function<Widget, Widget, bool> {
- bool operator() (const Widget& lhs, const Widget& rhs) const;
- };
虽然operator()的参数类型都是const
Widget&,但我们传递给binary_function的类型却是Widget。一般情况下,传递给unary_function或 binary_function的非指针类型需要去掉const和引用(&)部分(不要问其中的原因,如果你有兴趣,可以访问 boost.org,卡可能看他们在调用特性(traits)和函数对象配接器方面的工作)。
如果operator()带有指针参数,规则又有不同了。下面是WidgetNameCOmpare函数子的另一个版本,所不同的是,这次以Widget*指针作为参数:
- struct PtrWidgetNameCompare:
- public std::binary_function<const Widget*, const Widget*, bool>
- {
- bool operator() (const Widget* lhs, const Widget* rhs) const;
- };
第41条:理解ptr_fun、mem_fun和mem_fun_ref的来由。
如果有一个函数f和一个对象x,现在希望在x上调用f,而我们在x的成员函数之外,那么为了执行这个调用,C++提供了三种不同的语法:
f(x); //语法#1:f是一个非成员函数
x.f(); //语法#2:f是一个成员函数,并且x是一个对象或一个对象引用
p->f(); //语法#3:f是成员函数,并且p是一个指向对象x的指针
现在假设有个可用于测试Widget对象的函数:
void test(Widget& w);
另有一个存放Widget对象的容器:
vector<Widget> vw;
为了测试vw中的每一个Widget对象,自然可以用如下的方式来调用for_each:
for_each(vw.begin(), vw.end(), test); //调用#1
(可以通过编译)
但是,加入test是Widget的成员函数,即Widget支持自测:
- class Widget
- {
- public:
- ...
- void test();
- ....
- };
那么在理想情况下,应该也可以用for_each在vw中的每个对象上调用Widget::test成员函数:
for_each(vw.begin(), vw.end(), &Widget::test);//调用#2(不能通过编译)
实际上,如果真的很理想的话,那么对于一个存放Widget* 指针的容器,应该也可以通过for_each来调用Widget::test:
list<Widget*> lpw;
for_each(lpw.begin(), lpw.end(), &Widget::test);//调用#3(也不能通过编译)
这是因为STL中一种和普遍的惯例:函数或函数对象在被调用的时候,总是使用非成员函数的语法形式(即#1)。
现在mem_fun和mem_fun_ref之所以必须存在已经很清楚了--它们被用来调整(一般是#2和#3)成员函数,使之能够通过语法#1被调用。 mem_fun、mem_fun_ref的做法其实很简单,只要看一看其中任意一个函数的声明就清楚了。它们是真正的函数模板,针对它们所配接的成员函数的圆形的不同,有几种变化形式。我们来看其中一个声明,以便了解它是如何工作的:
template<typename R, typename C> //该mem_fun声明针对不带参数的非const成员函数,C是类,R是所指向的成员函数的返回类型
mem_fun_t<R,C>
mem_fun(R(C::*pmf) ());
mem_fun带一个指向某个成员函数的指针参数pmf,并且返回一个mem_fun_t类型的对象。mem_fun_t是一个函数子类,它拥有该成员函数的指针,并提供了operator()函数,在operator()中调用了通过参数传递进来的对象上的该成员函数。例如,请看下面一段代码:
list<Widget*> lpw;
...
for_each(lpw.begin(),lpw.end(),mem_fun(&Widget::test));//现在可以通过编译了
for_each接受到一个类型为mem_fun_t的对象,该对象中保存了一个指向Widget::test的指针。对于lpw中的每一个 Widget*指针,for_each将会使用语法#1来调用mem_fun_t对象,然后,该对象立即用语法#3调用Widget*指针的 Widget::test()。
(ptr_fun是多余的吗?)mem_fun是针对成员函数的配接器,mem_fun_ref是针对对象容器的配接器。
第42条:确保less<T>与operator<具有相同的含义。
operator<不仅仅是less的默认实现方式,它也是程序员期望less所做的事情。让less不调用operator<而去坐别的事情,这会无端地违背程序员的意愿,这与“少”带给人惊奇的原则(the
principle of least astonishment)完全背道而驰。这是很不好的,你应该尽量避免这样做。
如果你希望以一种特殊的方式来排序对象,那么最好创建一个特殊的函数子类,它的名字不能是less。
第7章 在程序中使用STL
第43条:算法调用优于手写的循环。
有三个理由:
效率:算法通常比程序员自己写的循环效率更高。
STL实现者可以针对具体的容器对算法进行优化;几乎所有的STL算法都使用了复杂的计算机科学算法,有些科学算法非常复杂,并非一般的C++程序员所能够到达。
正确性:自己写的循环比使用算法容易出错。
比如迭代器可能会在插入元素后失效。
可维护性:使用算法的代码通常比手写循环的代码更加简介明了。
算法的名称表明了它的功能,而for、while和do却不能,每一位专业的C++程序员都应该知道每一个算法所做的事情,看到一个算法就可以知道这段代码的功能,而对于循环只能继续往下看具体的代码才能懂代码的意图。
第44条:容器的成员函数优先于同名的算法。
第一:成员函数往往速度快;第二,成员函数通常与容器(特别是关联容器)结合得更紧密(相等和等价的差别,比如对于关联容器,count只能使用相等测试)。
第45条:正确区分count、find、binary_search、lower_bound、upper_bound和equal_range。
想知道什么 |
使用算法 |
使用成员函数 |
||
对未排序的区间 |
对排序的区间 |
对set或map |
对multiset或multimap |
|
特定的值存在吗 |
find |
binary_search |
count |
find |
特定的值存在吗?如果有,第一个在哪里 |
find |
equal_range |
find |
find或lower_bound |
第一个不超过特定值的对象在哪里 |
find_if |
lower_bound |
lower_bound |
lower_bound |
第一个超过某个特定值的对象在哪里 |
find_if |
upper_bound |
upper_bound |
upper_bound |
具有特定值的对象有多少个 |
count |
equal_range (然后distance) |
count |
count |
具有特定值的对象都在哪里 |
find(反复调用) |
equal_range |
equal_range |
equal_range |
第46条:考虑使用函数对象而不是函数指针作为STL算法的参数。
函数指针抑制了内联机制,而函数对象可以被编译器优化为内联。
另一个理由是,这样做有助于避免一些微妙的、语言本身的缺陷。在偶然的情况下,有些看似合理的代码会被编译器以一些合法但又含糊不清的理由而拒绝。例如,当一个函数模板的实例化名称并不完全等同于一个函数的名称时,就可能会出现这样的问题。下面是一个例子:
- template<typename FPType>
- FPType average(FPType val1, FPType val2)//返回两个浮点的平均值
- {
- return (val1 + val2) / 2;
- }
- template<typename InputIter1,typename InputIter2>
- void writeAverages(InputIter1 begin1, INputIter1 end1, InputIter2 begin2,ostream& s) //将两个序列的值按顺序对应取平均,然后写到一个流中
- {
- transform(begin1, end1, begin2,
- ostream_iterator<typename iterator_trais<InputIterl>::value_type(s,"\n")>,
- average<typename iterator_traits<InputIterl>::value_type>//错误?
- );
- }
许多编译器接受这段代码,但是C++标准却不认同这样的代码。原因在于,理论上存在另一个名为average的函数模板,它也只带一个类型参数。如果这样的话,表达式average<typename
iterator_traits<InputIterl>::value_type>就会有二义性,因为编译器无法分辨到底应该实例化哪一个模板。换成函数对象就可以了。
第47条:避免产生“直写型”(write-only)的代码。
代码被阅读的次数远远大于它被编写的次数。
第48条:总是包含(#include)正确的头文件。
几乎所有的标准STL容器都被声明在与之同名的头文件中。
除了4个STL算法外,其他所有的算法都被声明在<algorithm>中,这4个算法是accumulate、inner_product、adjacent_difference和partial_sum,它们都被声明在头文件<numeric> 中。
特殊类型的迭代器,包括istream_iterator和istreambuf_iterator(见第29条),被声明在<iterator>中。
标准的函数子(比如less<T>)和函数子配接器(比如not1、bind2nd)被声明在头文件<functional>中。
第49条:学会分析与STL相关的编译器诊断信息。
用文本替换(例如用string替换掉basic_string<char,struct
std::char_traits<char>,class std::allocator<char> >)。
第50条:熟悉STL相关的Web站点。
SGI STL站点:http://www.sig.com/tech/stl/
STLport站点:http://stlport.org
BOost站点:http://boost.org
学习笔记:STL的更多相关文章
- C++学习笔记——STL(标准模板库)
1.首先.需要学习C++ 模板的概念 2.C++ STL(标准模板库)是一套功能强大的 C++ 模板类,提供了通用的模板类和函数,这些模板类和函数可以实现多种流行和常用的算法和数据结构,如向量.链表. ...
- STL学习笔记---STL简介
1.概述 STL是通用类模版和算法的集合,它提供给程序员一些标准的数据结构和算法的实现.STL三大关键组成: 容器(Containers),用来管理类对象的集合 迭代器(Iterators),用来在一 ...
- VC学习笔记----STL库
STL = Standard Template Library,标准模板库,惠普实验室开发的一系列软件的统称.它是由Alexander Stepanov.Meng Lee和David R Muss ...
- C++学习笔记-STL
C++ STL (Standard Template Library标准模板库) 是通用类模板和算法的集合,它提供给程序员一些标准的数据结构的实现如 queues(队列), lists(链表), 和 ...
- Day 3 学习笔记
Day 3 学习笔记 STL 模板库 一.结构体 结构体是把你所需要的一些自定义的类型(原类型.实例(:包括函数)的集合)都放到一个变量包里. 然后这个变量包与原先的类型差不多,可以开数组,是一种数据 ...
- STL学习笔记序言
笔者作为计算机科学与技术专业的学生,学习并使用C++已经有3年了.在接触STL之前的编程习惯是,所有程序的功能包括数据结构.算法等都是亲自实现,效率极其缓慢.后来从使用STL的vector开始慢慢的感 ...
- Effective STL 学习笔记 39 ~ 41
Effective STL 学习笔记 39 ~ 41 */--> div.org-src-container { font-size: 85%; font-family: monospace; ...
- Effective STL 学习笔记 Item 38 : Design functor classes for pass-by-value
Effective STL 学习笔记 Item 38 : Design functor classes for pass-by-value */--> div.org-src-container ...
- Effective STL 学习笔记 Item 34: 了解哪些算法希望输入有序数据
Effective STL 学习笔记 Item 34: 了解哪些算法希望输入有序数据 */--> div.org-src-container { font-size: 85%; font-fam ...
- Effective STL 学习笔记 32 ~ 33
Effective STL 学习笔记 32 ~ 33 */--> div.org-src-container { font-size: 85%; font-family: monospace; ...
随机推荐
- 【BZOJ】1152: [CTSC2006]歌唱王国Singleland
题解 读错题了,是最后留下一个牛人首长歌颂他,和其他人没有关系,t就相当于数据组数 结论题,具体可看 https://www.zhihu.com/question/59895916/answer/19 ...
- linux下更换pip源
pip不更换源的话,速度可能非常慢.这里将pip源更换为阿里云源. 1.修改文件~/.pip/pip.conf(没有该文件则创建一个) $ sudo vim ~/.pip/pip.conf 2.写入以 ...
- thinkphp3.2链接数据库常用的配置选项
thinkphp3.2常用配置选项,app/Common/Conf/config.php 或者 app/Home/Conf/config.php 1 2 3 4 5 6 7 8 'SHOW_PAGE_ ...
- RTSP 资料
分享两个不错的播客. http://blog.csdn.net/u010425035/article/details/10410851 http://blog.csdn.net/xiaoyafang1 ...
- Ext.example.msg()应用
①需要在开发包中包含文件夹example/shared中的example.js和example.css两个文件即可. ②在html文件中引入: <script src="../extj ...
- POJ - 3111 K Best 0-1分数规划 二分
K Best Time Limit: 8000MS Memory Limit: 65536K Total Submissions: 12812 Accepted: 3290 Case Time ...
- c/c++--strlen()小问题
int x = 2; char * str = "abcd"; int y = (x - strlen(str)) / 3; printf("%d\n", y) ...
- CentOS日志的简单介绍
在CentOS7中,系统的日志消息由两个服务负责处理:system-journald和rsyslog. (1).常见的日志及作用 /var/log目录里存放了一些特定于系统和服务的日志文件,由rsys ...
- Fiddler手机抓包,相关细节回顾
目录 0. 准备工作 1. Fiddler配置 2. iPhone配置 3. 抓包示例 上篇Fiddler教程,我们教了大家Fiddler安装配置及如何使用Fiddler进行基本的Http抓包及模拟请 ...
- bzoj 1027 floyd求有向图最小环
结合得好巧妙.... 化简后的问题是: 给你两个点集A,B,求B的一个子集BB,使得BB的凸包包含A的凸包,求BB的最小大小. 先特判答案为1,2的情况,答案为3的情况,我们先构造一个有向图: 对于B ...