Item 19: 使用srd::shared_ptr来管理共享所有权的资源
本文翻译自modern effective C++,由于水平有限,故无法保证翻译完全正确,欢迎指出错误。谢谢!
博客已经迁移到这里啦
使用带垃圾回收机制语言的程序员指出并嘲笑C++程序员需要遭受防止资源泄漏的痛苦。“多么原始啊”他们嘲笑道,“20世纪60年代的Lisp留下的备忘录你还不记得了吗?机器(而不是人类)应该管理资源的生命周期”。C++开发人员转了转他们的眼睛,“你所说的备忘录是指,那些资源只有内存以及资源的回收时间不确定的时候吗?我们更喜欢比较普遍以及可预测的析构函数,谢谢你。”但是我们只是虚张声势而已。垃圾回收机制确实很方便,而且手动的生命周期管理确实看起来像:使用石刀和熊皮来构造一个记忆存储电路(意味着几乎不可能的任务,constructing a mnemonic memory circuit using
stone knives and bear skins,出自星际迷途)。为什么我们不能同时拥有两个世界的精华部分呢:创造一个系统,这个系统能自动工作(比如垃圾回收机制),还能应用到所有资源上以及能拥有可预测的生命周期(比如析构函数)?
C++11中是用std::shared_ptr把两个世界的优点绑定在一起的。通过std::shared_par可以访问对象,这个对象的生命周期由智能指针以共享所有权的语义来管理。没有一个明确的std::shared_ptr占有这个对象。取而代之的是,所有指向这个对象的std::shared_ptr一起合作来确保:当这个对象不再被需要的时候,它能被销毁。当最后一个指向对象的std::shared_ptr不再指向这个对象(比如,因为std::shared_ptr被销毁了或者指向了别的对象)std::shared_ptr会销毁它指向的对象。就像垃圾回收机制一样,客户不需要管理被指向的对象的生命周期了,但是和析构函数一样,对象的销毁的时间是确定的。
通过查看引用计数(reference count,一个和资源关联的值,这个值能记录有多少std::shared_ptr指向资源),一个std::shared_ptr能告诉我们它是否是最后一个指向这个资源的指针。std::shared_ptr的构造函数会增加引用计数(通常,而不是总是,请看下面),std::shared_ptr的析构函数会减少引用计数,拷贝operator=既增加也减少(如果sp1和sp2是指向不同对象的std::shared_ptr,赋值操作“sp1 = sp2”会修改sp1来让它指向sp2指向的对象。这个赋值操作最后产生的效果就是:原本被sp1指向的对象的引用计数减少了,同时被sp2指向的对象的引用计数增加了。)如果一个std::shared_ptr看到一个引用计数在一次自减操作后变成0了,这就意味着没有别的std::shared_ptr指向这个资源了,所以std::shared_ptr就销毁它了。
引用计数的存在带来的性能的影响:
std::shared_ptr是原始指针的两倍大小,因为它们在内部包含了一个指向资源的原始指针,同时包含一个指向资源引用计数的原始指针。
引用计数的内存必须动态分配。概念上来说,引用计数和被指向的资源相关联,但是被指向的对象不知道这件事。因此它们没有地方来存放引用计数。(这里隐含一个令人愉快的提示:任何对象,即使是built-in类型的对象都能被std::shared_ptr管理)Item 21解释了,当使用std::make_shared来创建std::shared_ptr时,动态分配的花费能被避免,但是这里有一些无法使用std::make_shared的情况。不管哪种方式,引用计数被当成动态分配的数据来存储。
引用计数的增加和减少操作必须是原子的,因为在不同的线程中可能同时有多个reader和writer。举个例子,在某个线程中指向的一个资源的std::shared_ptr正在调用析构函数(因此减少它指向的资源的引用计数),同时,在不同的线程中,一个指向相同资源的std::shared_ptr被拷贝了(因此增加了资源的引用计数)。原子操作通常比非原子操作更慢,所以即使引用计数常常只有一个字节的大小,你应该假设对它们的读写是相当费时的。
不知道我之前写的“std::shared_ptr的构造函数只是“通常”增加它指向的对象的引用计数”有没有刺激到你的好奇心。创建一个指向某个对象的std::shared_ptr总是产生一个额外std::shared_ptr指向这个对象,所以为什么我们不能总是增加它的引用计数呢?
move构造函数,这就是原因。从另外一个std::shared_ptr移动构造一个std::shared_ptr会设置源std::shared_ptr为null,这意味着旧的std::shared_ptr停止指向资源的同时新的std::shared_ptr开始指向资源。所以,它不需要维护引用计数。因此move std::shared_ptr比拷贝它们更快:拷贝需要增加引用计数,但是move不会。这对赋值操作来说也是一样的,所以move构造比起拷贝构造更快,move operator=比拷贝operator=更快。
和std::unique_ptr(看Item 18)相似的是,std::shared_ptr使用delete作为它默认的资源销毁机制,但是它也能支持自定义的deleter。但是,它的设计和std::unique_ptr不一样。对于std::unique_ptr来说,deleter的类型是智能指针类型的一部分。但是对std::shared_ptr来说,它不是:
auto loggingDel = [] (Widget *pw) //自定义deleter
{
makeLogEnty(pw);
delete pw;
}
std::unique_ptr< //deleter的类型是指针
Widget, decltype(loggingDel) //类型的一部分
> upw(new Widget, loggingDel);
std::shared_ptr<Widget> //deleter的类型不是指针
spw(new Widget, loggingDel); //类型的一部分
std::shared_ptr的设计更加灵活。考虑一下两个std::shared_ptr,它们带有不同的自定义deleter。(比如,因为自定义deleter是通过lambda表达式确定的):
auto customDeleter1 = [](Widget *pw) { ... }; //自定义deleter
auto customDeleter2 = [](Widget *pw) { ... }; //不同的类型
std::shared_ptr<Widget> pw1(new Widget, customDeleter1);
std::shared_ptr<Widget> pw2(new Widget, customDeleter2);
因为pw1和pw2有相同类型,它们能被放在同一个容器中:
std::vector<std::shared_ptr<Widget>> vpw{ pw1, pw2 };
它们能互相赋值,并且它们都能被传给一个函数作为参数,只要这个函数的参数是std::shared_ptr类型。这些事使用std::unique_ptr(根据自定义deleter来区分类型)都做不到,因为自定义deleter的类型会影响到std::unique_ptr的类型。
另外一个和std::unique_ptr不同的地方是,指定一个自定义deleter不会改变一个std::shared_ptr对象的大小。无论一个deleter是什么,一个std::shared_ptr对象都是两个指针的大小。这是一个好消息,但是它也会让你隐约感到一点不安。自定义deleter可以是一个仿函数,并且仿函数能包含任意多的数据。这意味着它们能变得任意大。那么一个std::shared_ptr怎么能指向一个任意大小的deleter却不使用任何内存呢?
它不能,它必须要用更多的内存。但是,这些内存不是std::shared_ptr对象的一部分。它在堆上,或者,如果一个std::shared_ptr的创造者利用std::shared_ptr支持自定义内存分配器的特性来优化它,那么它就在内存分配器管理的内存中。我之前提过一个std::shared_ptr对象包含一个指向引用计数(std::shared_ptr指向的对象的引用计数)的指针。这是对的,但是我有点误导你了,因为,引用计数只是更大的数据结构(被称为控制块(control block))的一部分。每一个被std::shared_ptr管理的对象都有一个控制块。除了引用计数,控制块还包含:一个自定义deleter的拷贝(如果有的话),一个自定义内存分配器的拷贝(如果有的话),额外的数据(包括weak count, Item 21中解释的第二个引用计数,但是我们在本Item中会忽略这个数据)。我们能把和std::shared_ptr对象关联的内存模型想象成这个样子:
一个对象的控制块是被指向这个对象的第一个std::shared_ptr创建的。至少这是应该发生的。通常,一个创建std::shared_ptr的函数是不可能知道是否有其他std::shared_ptr已经指向这个对象了,所以控制块的创建遵循这些规则:
std::make_shared(看Item 21)总是创建一个控制块,它制造一个新对象,所以可以肯定当std::make_shared被调用的时候,这个对象没有控制块。
当一个std::shared_ptr构造自一个独占所有权的指针(也就是,一个std::unique_ptr或std::auto_ptr)时,创造一个控制块。独占所有权的指针不使用控制块,所以被指向的对象没有控制块。(作为构造的一部分,std::shared_ptr需要承担被指向对象的所有权,所以独占所有权的指针被设置为null)
当使用一个原始指针调用std::shared_ptr的构造函数构造函数时,它创造一个控制块。如果你想使用一个已经有控制块的对象来创建一个std::shared_ptr的话,你可以传入一个std::shared_ptr或一个std::weak_ptr(看Item 20)作为构造函数的参数,但不能传入一个原始指针。使用std::shared_ptr或std::weak_ptr作为构造函数的参数不会创建一个新的控制块,因为它们能依赖传入的智能指针来指向必要的控制块。
这些规则导致的一个结果就是:用一个原始指针来构造超过一个的std::shared_ptr对象会让你免费坐上通往未定义行为的粒子加速器,因为被指向的对象会拥有多个控制块。多个控制块就意味着多个引用计数,多个引用计数就意味着对象会被销毁多次(一个引用计数一次)。这意味着这样的代码是很糟糕很糟糕很糟糕的:
auto pw = new Widget; //pw是原始指针
...
std::shared_ptr<Widget> spw1(pw, loggingDel); //创建一个*pw的控制块
...
std::shared_ptr<Widget> spw2(pw, loggingDel); //创建第二个*pw的控制块
创建一个原始指针pw指向动态分配的对象是不好的,因为它和这一整章的建议相违背:比起原始指针优先使用智能指针(如果你已经忘记这个建议的动机了,在115页刷新一下你的记忆)但是先把它放在一边。创建pw的这一行在格式上是令人厌恶的,但是至少它不会造成未定义的程序行为。
现在,用原始指针调用spw1的构造函数,所以它为指向的对象创建了一个控制块(因此也创建了一个引用计数)。在这种情况下,被指向对象就是pw(也就是pw指向的对象)。就其本身而言,这是可以的,但是spw2的构造函数的调用,使用的是同样的原始指针,所以它也为pw创建一个控制块(因此又创建了一个引用计数)。因此pw有两个引用计数,每个引用计数最终都会变成0,并且这最终将企图销毁pw两次。第二次销毁会造成未定义行为。
关于std::shared_ptr的使用,上面的例子给我们两个教训。第一,尽量避免传入一个原始指针给一个std::shared_ptr的构造函数。通常的替换品是使用std::make_shared(看Item 21),但是在上面的例子中,我们使用了自定义deleter,那就不能使用std::make_shared了。第二,如果你必须传入一个原始指针给std::shared_ptr的构造函数,那么用“直接传入new返回的结果”来替换“传入一个原始指针变量”。如果上面的代码的第一部分被写成这样:
std::shared_ptr<Widget> spw1(new Widget, loggingDel); //直接使用new
这样就没有来自“使用同样的原始指针来创建第二个std::shared_ptr”的诱惑了。取而代之的是,代码的作者会很自然地使用spw1做为一个初始化参数来创建spw2(也就是,将调用std::shared_ptr的拷贝构造函数),并且这将不会造成任何问题:
std::shared_ptr<Widget> spw2(spw1); //spw2使用的控制块和spw1一样
使用原始指针变量作为std::shared_ptr构造函数的参数时,有一个特别让人惊奇的方式(涉及到this指针)会产生多个控制块。假设我们的程序使用std::shared_ptr来管理Widget对象,并且我们有一个数据结构保存处理过的Widget:
std::vector<std::shared_ptr<Widget>> processedWidgets;
进一步假设Widget有一个成员函数来做相应的处理:
class Widget {
public:
...
void process();
...
};
这里有一个“看起来合理”的方法能用在Widget::process上:
void Widget::process()
{
... //处理Widget
processedWidgets.emplace_back(this); //把它加到处理过的Widget的
//列表中去,这是错误的!
}
注释上说这会产生错误已经说明了一切(或者大部分事实,错误的地方是传入this,而不是emplace_back的使用。如果你不熟悉emplace_back,请看Item 42),这段代码能编译,但是它传入一个原始指针(this)给一个std::shared_ptr的容器。因此std::shared_ptr的构造函数将为它指向的Widget(*this)创建一个新的控制块。直到你意识到如果在成员函数外面已经有std::shared_ptr指向这个Widget前,这听起来都是无害的,这是对未定义行为的赌博,设置以及匹配。
std::shared_ptr的API包括一个为这种情况专用的工具。它有着标准C++库所有名字中有可能最奇怪的名字:std::enable_shared_from_this。如果你想要一个类被std::shared_ptr管理,你能继承自这个基类模板,这样就能用this指针安全地创建一个std::shared_ptr。在我们的例子中,Widget应该像这样继承std::enable_shared_form_this:
class Widget: public std::enable_shared_from_this<Widget> {
public:
...
void process();
...
};
就像我之前说的,std::enable_shared_from_this是一个基类模板。它的类型参数总是派生类的名字,所以Widget需要继承一个std::enable_shared_from_this。如果“派生类继承的基类需要用派生类来作为模板参数”让你感到头疼的话,不要去思考这个问题。代码是完全合理的,并且这背后是已经建立好的一个设计模式,它有一个标准的名字,虽然这个名字几乎和std::enable_shared_from_this一样奇怪。名字是“奇特的递归模板模式”(The Curiously Recurring Template
Pattern, 简称CRTP)。如果你想要学一下这个方面的知识的话,打开你的搜索引擎把,因为在这里,我们需要回到std::enable_shared_from_this。
std::enable_shared_from_this定义一个成员函数来创建一个指向正确对象的std::shared_ptr,但是它不复制控制块。成员函数是shared_from_this,并且当你想让std::shared_ptr指向this指针指向的对象时,你可以在成员函数中使用它。这里给出Widget::process的安全实现:
void Widget::process()
{
//和以前一样,处理Widget
...
//把指向当前对象的std::shared_ptr增加到processedWidgets中去
processedWidgets.emplace_back(shared_from_this());
}
在其内部,shared_from_this查找当前对象的控制块,并且创建一个新的std::shared_ptr并让它指向这个控制块。这个设计依赖于当前的对象已经有一个相关联的控制块了。这样的话,这里就必须有一个存在的std::shared_ptr(比如,一个调用shared_from_this的成员函数的外部)指向当前的对象。如果没有这样的std::shared_ptr存在(也就是如果当前对象没有和任何控制块关联),即使shared_from_this通常会抛出一个异常,它的行为还将是未定义的。
为了防止客户在一个std::shared_ptr指向这个对象前,调用成员函数(这个成员函数调用了shared_from_this),继承自std::enable_shared_from_this的类常常声明它们的构造函数为private,并且让客户通过调用一个返回std::shared_ptr的工厂函数来创建对象,举个例子,看起来像这样:
class Widget: public std::enable_shared_from_this<Widget> {
public:
//工厂函数,完美转发参数给一个private
//构造函数
template<typename... Ts>
static std::shared_ptr<Widget> create(Ts&&... params);
...
void process();
...
private:
... //构造函数
};
现在,你可能只能模糊地回想起我们对控制块的讨论是出于:理解和std::shared_ptr有关的费用。现在我们理解了怎么避免创建太多的控制块,让我们回到原始的话题。
一个控制块通常只有几个字节的大小,尽管自定义deleter和自定义内存分配器能让它变得更大。控制块的通常实现可能比你想象的要更加复杂。它利用继承,甚至一个虚函数(用来确保指向的对象被正确地销毁)这意味着使用std::shared_ptr也会招致使用虚函数(被控制块使用)的成本。
读了关于动态分配控制块,任意大的deleter和内存分配器,虚函数机制,以及原子引用计数操作。你对std::shared_ptr的热情可能多少已经衰减了。很好,它们不是每一种资源管理问题的最好解决办法。但是为了它们提供的功能,std::shared_ptr的这些付出还是合理的。在典型的条件下,当使用默认deleter以及默认内存分配器,并且使用std::make_shared来创建std::shared_ptr时,控制块只有3字节的大小,并且它的分配本质上是免费的(这包括被指向的对象的内存的分配,细节部分看Item 21)解引用一个std::shared_ptr不会比解引用一个原始指针更昂贵。执行一个需要改动引用计数的操作(比如,拷贝构造函数或拷贝operator=,析构函数)需要承担一个或两个原子操作,但是这些操作通常被映射到独立的机器指令上,所以即使他们可能比起非原子指令更昂贵,但是他们仍然是单条指令。控制块中的虚函数机制,在每个被std::shared_ptr管理的对象中只使用一次:对象销毁的时候。
用这些适度的花费作为交换,你能得到的是,对动态分配资源的生命周期的自动管理。大多数时候,对于共享所有权的对象的生命周期,比起手动管理来说,使用std::shared_ptr是更好的选择。如果你发现你在纠结是否承担得起std::shared_ptr所带来的负担,你需要再考虑一下你是否真的需要共享所有权。如果独享所有权能够做到的话,std::unique_ptr是更好的选择。它的性能状况和原始指针是很接近的,并且从std::unique_ptr“升级”到std::shared_ptr也很简单,因为一个std::shared_ptr能使用一个std::unique_ptr来创建。
反过来就不对了。一旦你已经把对资源的生命周期的管理交给了std::shared_ptr,你的想法就不能再改变了。即使它的引用计数是1,你也不能改变资源的所有权,也就是说,让一个std::unique_ptr来管理它。std::shared_ptr和资源之间的所有权合同指出它是“死前永远在一起”的类型,没有分离,没有取消,没有分配。
另外std::shared_ptr不能和数组一起工作。到目前为止这是另外一个和std::unique_ptr不同的地方,std::shared_ptr的API被设计为只能作为单一对象的指针。这里没有std::shared_ptr<T[]>。有时候,“聪明的”程序员会这么想:使用一个std::shared_ptr来指向一个数组,确定一个自定义deleter来执行数组的销毁(也就是delete[])。这能编译通过,但是它是一个可怕的想法。首先,std::shared_ptr没有提供operator[],所以数组的索引操作就要求基于指针运算来实现,这很尴尬。另外,对于单个对象来说,std::shared_ptr支持从“派生类到基类的”转换,但是当应用到数组中时,这将开启一扇未知的大门(就是这个原因,std::unique_ptr<T[]>API禁止这样的转换)。最重要的是,既然C++11已经给出了多种built-in数组的替代品(比如,std::array,std::vector,std::string),声明一个指向原始数组的智能指针总是标识着,这是一个糟糕的设计。
你要记住的事
- std::shared_ptr提供和垃圾回收机制差不多方便的方法,来对任意的资源进行共享语义的生命周期管理。
- 比起std::unique_ptr,std::shared_ptr对象常常是它的两倍大,需要承担控制块的间接费用,并且需要原子的引用计数操作。
- 默认的资源销毁操作是通过delete进行的,但是自定义deleter是支持的。deleter的类型不会影响到std::shared_ptr的类型。
- 避免从原始指针类型的变量来创建std::shared_ptr。
Item 19: 使用srd::shared_ptr来管理共享所有权的资源的更多相关文章
- Item 18: 使用srd::unique_ptr来管理独占所有权的资源
本文翻译自modern effective C++,由于水平有限,故无法保证翻译完全正确,欢迎指出错误.谢谢! 博客已经迁移到这里啦 当你需要一个智能指针的时候,std::unique_ptr通常是最 ...
- Oracle DB 自动管理共享内存
• 启用Oracle Enterprise Manager (EM) 内存参数 • 设置自动优化的内存参数 • 使用手动优化的SGA 参数覆盖最小大小 • 使用SGA Advisor 设置SGA_TA ...
- SharePoint 2016 工作流报错“未安装应用程序管理共享服务代理”
前言 最近为SharePoint 2016环境,配置了状态机工作流,然后,用spd创建的时候可以保存,但是发布的时候报错,经过排查解决了问题,记录一下. 报错截图 下面是SharePoint Desi ...
- Pod——状态和生命周期管理及探针和资源限制
一.什么是Podkubernetes中的一切都可以理解为是一种资源对象,pod,rc,service,都可以理解是 一种资源对象.pod的组成示意图如下,由一个叫”pause“的根容器,加上一个或多个 ...
- SharePoint管理中心来配置资源限制(大名单)
SharePoint管理中心来配置资源限制(大名单) 名单SharePoint核心.SharePoint一切的一切都是列表. 我可以说SharePoint内容为驱动的列表. 之前版本号的SharePo ...
- nginx-tomcat负载均衡redis-session共享,静态资源分离
nginx-tomcat负载均衡redis-session共享.静态资源分离 基本环境: redis-2.8 apache-tomcat-6.0.41 nginx1.6.2 1.redis配置 1,配 ...
- 深入学习c++--多线程编程(二)【当线程间需要共享非const资源】
1. 遇到的问题 #include <iostream> #include <thread> #include <chrono> #include <futu ...
- Terraform入门教程,示例展示管理Docker和Kubernetes资源
我最新最全的文章都在南瓜慢说 www.pkslow.com,欢迎大家来喝茶! 1 简介 最近工作中用到了Terraform,权当学习记录一下,希望能帮助到其它人. Terraform系列文章如下: T ...
- 读书笔记 effective c++ Item 19 像设计类型(type)一样设计
1. 你需要重视类的设计 c++同其他面向对象编程语言一样,定义了一个新的类就相当于定义了一个新的类型(type),因此作为一个c++开发人员,大量时间会被花费在扩张你的类型系统上面.这意味着你不仅仅 ...
随机推荐
- (后端)mybatis中使用Java8的日期LocalDate、LocalDateTime
原文地址:https://blog.csdn.net/weixin_38553453/article/details/75050632 MyBatis的型处理器是属性“createdtime参数映射为 ...
- SAP生产机该不该开放Debuger权限
前段时间公司定制系统在调用SAP RFC接口的时候报错了,看错误消息一时半会儿也不知道是哪里参数数据错误,就想着进到SAP系统里面对这个接口做远程Debuger,跟踪一下参数变量的变化,结果发现根本就 ...
- jdk各版本特性
JDK Version 1.0 开发代号为Oak(橡树),于1996-01-23发行. JDK Version 1.1 于1997-02-19发行. 引入的新特性包括: 引入JDBC(Java Dat ...
- Navicat Premium 连接oracle ORA-01017:用户名/口令无效;登陆被拒绝
解决的方法就是将用户名改成system
- MySQL高性能优化实战总结!
1.1 前言 MySQL对于很多Linux从业者而言,是一个非常棘手的问题,多数情况都是因为对数据库出现问题的情况和处理思路不清晰.在进行MySQL的优化之前必须要了解的就是MySQL的查询过程,很多 ...
- UITableView的分割线长短的控制
UITableView的默认的cell的分割线左边没有顶满,而右边却顶满了.这样显示很难看.我需要让其左右两边都是未顶满状态,距离是20像素 // code1 if ([self.tableView ...
- [HBase_1] HBase安装与配置
0. 说明 1. 简介 1.1 简介 基于 HDFS 的大表软件(实时数据库) 十亿行 x 百万列 x 上千个版本 版本是通过 mvcc 技术控制:multiple version concurren ...
- Spring MVC 之请求参数和路径变量
请求参数和路径变量都可以用于发送值给服务器.二者都是URL的一部分.请求参数采用key=value形式,并用“&”分隔. 例如,下面的URL带有一个名为productId的请求参数,其值为3: ...
- nodejs前后分离
proxy: { '/api': { target: 'http://localhost:3000/', pathRewrite: {'^/api' : ''}, changeOrigin: true ...
- Mysql 数据库设置三大范式 数据库五大约束 数据库基础配置
数据库设置三大范式 1.第一范式(确保每列保持原子性) 第一范式是最基本的范式.如果数据库表中的所有字段值都是不可分解的原子值,就说明该数据库满足第一范式. 第一范式的合理遵循需要根据系统给的实际需求 ...