Allocation-Free Collections(在堆栈上使用内存)
假设你有一个方法,通过创建临时的List来收集某些数据,并根据这些数据来统计信息,然后销毁这个临时列表。这个方法被经常调用,导致大量内存分配和释放以及增加的内存碎片。此外,所有这些内存管理都需要时间,并且可能会影响性能。
对于这些情况,您可能希望将所有数据保留在堆栈(stack)中,并完全避免内存分配。我们向您展示了几种可以实现此目的的方法。
即使这些用例对你来说不适用,但你也可能会发现本文很有用,因为它使用了一些有趣的概念和Delphi语言功能。
堆栈与堆,值与参考类型(Stack vs Heap, Value vs Reference Types)
首先,让我们先了解一些术语。你可能已经知道本节中的所有内容,但无论如何我们都要回顾一下。
内部存储器有两种主要类型:堆栈和堆。堆栈被用于存储方法的局部变量和可能的其他数据(如在许多平台返回地址)。堆存储动态分配的内存,包括字符串,动态数组和对象。
当您了解了这些类型的内存时,您可能会在同一段落或章节中阅读有关值和引用类型的内容,因为这两者有些相关。值类型直接在存储器位置存储了一些值,而 参考类型存储的指针则指向位于别处(通常,但不是必须在一个值堆)。值类型的示例是整数,浮点数,布尔值,枚举,字符,记录和静态数组。引用类型的示例是字符串,对象,对象接口,动态数组和指针。
关于类和对象之间的区别存在争议,它们有时可以互换使用。我个人认为两者是不同的:一个类描述了契约(字段,方法,属性和事件),一个对象是一个类的特定实例。
只有值类型可以存储在堆栈中。在堆栈上声明引用类型时,只是其指针值存储在堆栈中 ; 实际值是在堆上分配的(如果没有,则为nil)。
procedure StackVsHeap;
var
A: Integer;
B: TList<Integer>;
begin
A := 42;
B := TList<Integer>.Create;
B.Add(42);
B.Add(100);
end;
这导致以下内存布局(内存位置仅供参考):
正如你所见,在创建TList
并在至少分配两个堆存储器来增加一些项目的结果:一个存储列表对象的实例数据(FItems
,FCount
以及一些其他字段)和一个用于存储物品的动态数组。在此示例中,动态数组可容纳4个项目,其中2个项目使用。动态数组将根据需要增长以容纳新项目。
基于堆栈的集合
您可能会遇到这些堆内存分配不理想的情况。它们可能会增加内存碎片,从而导致内存使用量增加。此外,分配和释放动态内存并不是一种廉价的操作,每秒多次创建临时列表可能会影响性能。另一方面,堆栈上的“分配”内存通常是零成本操作。它只涉及在方法开始时调整堆栈指针,编译器在大多数情况下都会这样做。
如果您可以完全在堆栈上创建一个集合(也就是说,集合属性FCount
和实际项目都应该存在于堆栈中),则可以解决这些问题。实际上,您之前可能已经使用过这些类型的集合:
procedure StaticArray;
var
Items: array [0..9] of Integer;
Count: Integer;
begin
...
end;
本地静态数组本质上是基于堆栈的集合,尽管不是用户友好的集合。为了使这个数组更像列表,我们可以用方法将它包装在一个记录中。
一个简单的基于堆栈的列表
一个简单的实现可能如下所示:
type
TStackList<T: record> = record
private type
P = ^T;
private
FData: array [0..255] of Byte;
FCapacity: Integer;
FCount: Integer;
function GetItem(const AIndex: Integer): T;
public
procedure Initialize;
procedure Clear;
procedure Add(const AItem: T); property Count: Integer read FCount;
property Items[const AIndex: Integer]: T read GetItem; default;
end;
您可以在AllocationFreeCollections目录中的GitHub上的JustAddCode存储库中找到此代码的更多文档版本(以及本文中的所有其他代码)。
你可能会发现这个名字TStackList
有点令人困惑。这里,单词“stack” 不是指类似堆栈的数据结构,而是指列表应该存在于内存堆栈中的事实。如果你要创建一个存在于内存堆栈中的类似堆栈的集合,那么就可以调用它TStackStack
。
这里有几点需要注意:
- 我选择在这里创建一个通用列表。如今,几乎不需要非通用列表。
- type参数
T
具有记录约束。这意味着列表只能保存值类型(暂时)。这在某种程度上简化了该列表的实现。 - 嵌套
type P = ^T;
声明对您来说可能是新的。它声明了一个指向列表中项目类型的类型指针。这在访问列表项的实现中很有用。 - 该列表将其项保存在256字节的静态数组中,这意味着它总是消耗256字节的(堆栈)内存,而不管类型如何
T
。因此,如果用于创建整数列表,则列表最多可以包含64个项目(因为整数大小为4个字节)。 - 您必须调用该
Initialize
方法来初始化或创建列表。此方法的作用类似于构造函数。由于记录不能没有参数的构造函数(至少在当前的Delphi版本中没有),我选择添加一个Initialize
方法。您也可以选择返回列表的静态方法(如class function Create: TStackList<T>; static;
),但从函数返回大型记录效率不高。 - 虽然你可以
TStackList
在一个对象中声明一个字段,但这并不是这个列表的目的而只是浪费内存。此类型旨在仅在方法中声明为局部变量。
实现非常简单。Initialize方法只计算集合可以容纳的项目数,并将该FCount
字段设置为0(因为在堆栈上声明时,记录中的字段未初始化为0)。
procedure TStackList<T>.Initialize;
begin
if IsManagedType(T) then
raise EInvalidOperation.Create(
'A stack based collection cannot contain managed types'); FCapacity := SizeOf(FData) div SizeOf(T);
FCount := 0;
end;
它还检查类型参数T
是否为托管类型,如果是,则引发异常。这可能值得一些解释。尽管type参数T
具有记录约束,但这并不意味着T
不能包含托管类型。例如,记录约束阻止Delphi编译:
var
List: TStackList<String>;
但不是从编译这个:
type
TStringWrapper = record
Value: String;
end;
var
List: TStackList<TStringWrapper>;
当type参数T
是引用类型或托管类型时,我们需要一些额外的代码来防止内存泄漏。我们稍后会谈到这一点并且暂时保持简单,不允许这样做。
添加项目的工作方式如下:
procedure TStackList<T>.Add(const AItem: T);
var
Target: P;
begin
if (FCount >= FCapacity) then
raise EInvalidOperation.Create('List is full'); Target := @FData[FCount * SizeOf(T)];
Target^ := AItem;
Inc(FCount);
end;
由于此列表的容量是固定的,因此我们需要在列表满时引发异常。我们稍后会看一个替代方案。
因为该FData
字段只是一个字节数组,所以我们需要一个技巧来将类型的项T
放入这个数组中。这是type P = ^T;
宣言派上用场的地方。我们计算FData
数组的偏移量并将其地址分配给Target
类型的变量P
。然后,我们可以取消引用此变量来分配值。检索项目的工作方式类似:
function TStackList<T>.GetItem(const AIndex: Integer): T;
var
Item: P;
begin
if (AIndex < 0) or (AIndex >= FCount) then
raise EArgumentOutOfRangeException.Create('List index out of range'); Item := @FData[AIndex * SizeOf(T)];
Result := Item^;
end;
您可以按如下方式使用此基于堆栈的列表(请参阅repo中的E01SimpleStackList示例):
procedure SimpleStackListExample;
var
List: TStackList<Integer>;
Error: Boolean;
I: Integer;
begin
List.Initialize; { TStackList<Integer> can contain up to 256 bytes of data. An Integer
is 4 bytes in size, meaning the list can contain up to 64 Integers. }
for I := 0 to 63 do
List.Add(I); { Adding 64'th item should raise an exception. }
Error := False;
try
List.Add(0);
except
Error := True;
end;
Assert(Error); { Check contents }
Assert(List.Count = 64);
for I := 0 to List.Count - 1 do
Assert(List[I] = I);
end;
具有可配置大小的堆栈列表
您可能会发现256字节的存储空间太少或太多。如果这个尺寸是可配置的,那将是很好的。如果Delphi更像C ++,我们可以使用这样的模板参数:
type
TStackList<T: record; N: Integer> = record
private
FData: array [0..N - 1] of Byte;
end; var
List: TStackList<Double, 1024>;
但是Delphi不是C ++,而泛型不是模板。那么我们怎样才能完成类似的事情?我们可以使用另一个类型参数而不是模板参数,其唯一目的是为列表项提供存储:
type
TStackList<T: record; TSize: record> = record
private
FData: TSize;
...
然后我们可以声明一个存储为1024字节的堆栈列表,如下所示:
type
T1024Bytes = record Data: array [0..1023] of Byte end; var
List: TStackList<Double, T1024Bytes>;
它的用法与前面介绍的固定大小的列表相同,可以在代码库中的E02StackListWithSize例子中找到此版本。
请注意,该T1024Bytes
类型声明包含在记录中的静态数组。因为TSize受
记录限制,静态数组本身不能用作类型,所以需要对记录封装一下。
该记录的实现也与前一个记录非常相似。但由于FData
不再是静态数组,我们需要不同的代码来计算项目的地址:
procedure TStackList<T, TSize>.Add(const AItem: T);
var
Target: P;
begin
if (FCount >= FCapacity) then
raise EInvalidOperation.Create('List is full'); Target := @FData;
Inc(Target, FCount);
Target^ := AItem; Inc(FCount);
end;
由于P
是一个类型指针,我们可以使用简单的指针逻辑处理运算。首先,我们设置Target指向
数组中第一个项的地址,然后用当前的增量来增加FCount
。作为参考,下面是完成相同计算的两种替代方法:
{$POINTERMATH ON}
Target := P(@FData) + FCount;
这会将计数直接添加到地址,而无需单独的Inc
语句。但这需要将P
进行类型转换并启用POINTERMATH
指令。
另一种方法是手动明确地进行整个计算:
Item := P(IntPtr(@FData) + (FCount * SizeOf(T)));
在,我们首先需要将地址转换为整数类型,最好是类型,IntPtr
以便在所有平台上兼容。之后,我们需要使用计数乘以列表项类型的大小来递增值。最后,我们需要对整个事物进行类型化P
。这是一种更复杂的方式来实现相同的东西,但它是编译器在幕后转换前两个版本的方式。所以很高兴知道发生了什么。
具有托管类型的列表
但是如果你想要一个字符串或对象列表呢?类型参数的记录约束T
当前不允许这样做。我们可以删除此约束,但是我们需要确保管理列表中的托管类型。E03StackListWithManagedTypes示例显示了执行此操作的方法。
首先,FData
当在堆栈上声明列表时,该字段通常包含随机数据。如果我们将此数据解释为托管类型的项目,那么这很可能会导致访问冲突,因为Delphi将尝试使用随机地址更新字符串(或其他托管类型)的引用计数。
所以我们需要FData
在Initialize
方法中明确:
procedure TStackList<T, TSize>.Initialize;
begin
...
if IsManagedType(T) then
FillChar(FData, SizeOf(FData), 0);
end;
请注意,仅当T是托管类型时才需要这样做,用IsManagedType
检查。
IsManagedType
是一个“编译器魔术”函数,这意味着if
在编译时而不是运行时评估条件。因此,当TStackList<Integer>
编译a时,检查和FillChar
语句将从代码中完全删除。另一方面,当TStackList<String>
编译a时,if
-check也会从代码中删除,但FillChar
语句仍然存在。该编译器的神奇功能(和其他编译器的魔法功能,如HasWeakRef
和GetTypeKind
)可以在创建避免运行时检查效率的代码有帮助。
此外,我们Finalize
现在需要一种方法(必须在一个finally
部分中调用)来释放列表中的托管项目。这个方法相当于析构函数:
procedure TStackList<T, TSize>.Finalize;
begin
Clear;
end; procedure TStackList<T, TSize>.Clear;
begin
if IsManagedType(T) then
begin
FinalizeArray(@FData, TypeInfo(T), FCount);
FillChar(FData, FCount * SizeOf(T), 0);
end;
FCount := 0;
end;
它使用单元中的FinalizeArray
例程System
来减少数组中项目的引用计数(取决于它们的类型)。如果没有这个,数组中的项将永远不会被释放,这会导致内存泄漏。
代码的其他部分保持不变。您可能想知道这部分代码是否仍能正常工作:
var
Target: P;
begin
Target := @FData;
Inc(Target, FCount);
Target^ := AItem;
end;
因为P
可能是指向托管类型的指针,您可能想知道此代码是否会绕过任何引用计数。不是这种情况。当Delphi为托管类型编译此代码时,它将确保分配Target^
将减少原始项目的引用计数(如果有)并增加新分配项目的引用计数。
一个可成长的堆栈列表
如果您事先知道列表将保留的最大项目数,则上面讨论的示例可以正常工作。再添加将导致异常。但是,如果你想利用堆栈的优势,但仍然能够在需要时增加集合呢?
因此,对于最后一个示例,我们将了解如何创建一个使用堆栈达到一定数量的列表,但是如果需要可以扩展到堆中。这可能提供两全其美:如果项目数量保持较低,则完全避免使用动态内存; 但如果需要,你仍然可以毫无问题地增加收藏。
您可以在repo中的E04GrowableStackList示例中找到此版本。此版本不允许其项目的托管类型,因此我们可以专注于“可增长”部分。
type
TStackList<T: record; TSize: record> = record
private
FStackData: TSize;
FStackCapacity: Integer;
FHeapData: Pointer;
FHeapCapacity: Integer;
FCount: Integer;
...
现在,当我们添加一个项目时,我们检查它是否仍然适合堆栈,如果没有,我们将在堆上增加集合:
procedure TStackList<T, TSize>.Add(const AItem: T);
var
Target: P;
Index: Integer;
begin
if (FCount < FStackCapacity) then
{ We can still add this item to the memory stack. }
Target := @FStackData;
Inc(Target, FCount);
else
begin
{ We need to add this item to heap memory.
First calculate the index into heap memory. }
Index := FCount - FStackCapacity; { Grow heap memory if needed to accommodate Index }
if (Index >= FHeapCapacity) then
Grow; Target := FHeapData;
Inc(Target, Index);
end; Target^ := AItem;
Inc(FCount);
end;
该FStackData
字段将保留第一FStackCapacity
项。堆上分配了任何其他项。该FHeapData
字段是指向最多可容纳FHeapCapacity
项目的数组的指针。达到此容量时,它将增加此内存块:
{$IF (RTLVersion < 33)}
procedure TStackList<T, TSize>.Grow;
begin
{ Pre-Rio growth strategy: double collection size }
if (FHeapCapacity = 0) then
FHeapCapacity := 4
else
FHeapCapacity := FHeapCapacity * 2;
ReallocMem(FHeapData, FHeapCapacity * SizeOf(T));
end;
{$ELSE}
procedure TStackList<T, TSize>.Grow;
begin
{ Delphi Rio introduced a user-configurable growth strategy }
FHeapCapacity := GrowCollection(FHeapCapacity, FHeapCapacity + 1);
ReallocMem(FHeapData, FHeapCapacity * SizeOf(T));
end;
{$ENDIF}
在这里,我们利用Delphi Rio引入的用户可配置增长策略。当使用较旧的Delphi版本时,我们默认将集合大小加倍。
检索项目时,我们还必须立即检查项目是在堆栈上还是在堆上:
function TStackList<T, TSize>.GetItem(const AIndex: Integer): T;
var
Item: P;
begin
if (AIndex < 0) or (AIndex >= FCount) then
raise EArgumentOutOfRangeException.Create('List index out of range'); if (AIndex < FStackCapacity) then
begin
Item := @FStackData;
Inc(Item, AIndex);
end
else
begin
Item := FHeapData;
Inc(Item, AIndex - FStackCapacity);
end; Result := Item^;
end;
最后,我们应该确保在Finalize
方法中释放任何已分配的堆数据。
何时不使用堆栈集合
基于堆栈的集合肯定有其用途,但好处取决于具体情况。如果您偶尔只需要一个临时列表,那么使用堆栈列表通常没有意义,您应该利用“常规”列表的灵活性。
此外,堆栈列表会占用堆栈上的内存。这通常不是问题,因为现在所有平台都提供了相当大的堆栈。但是如果在递归例程中使用堆栈列表,那么在某些时候可能会遇到堆栈溢出。所以我的建议是将堆栈列表的大小保持在几KB之内。如果你需要更多,那么内存碎片和速度可能不是你的瓶颈,常规列表就足够了。
因此,一如既往地使用,不仅仅是因为你可以。
如果您遇到基于堆栈的集合的任何有趣用例,请告诉我。
原文地址:https://blog.grijjy.com/2019/01/25/allocation-free-collections/
源码地址:https://github.com/grijjy/JustAddCode/tree/master/AllocationFreeCollections
https://www.cnblogs.com/kinglandsoft/p/10333874.html
Allocation-Free Collections(在堆栈上使用内存)的更多相关文章
- 如何判断一个C++对象是否在堆栈上(通过VirtualQuery这个API来获取堆栈的起始地址,然后就可以得到答案了),附许多精彩评论
昨天有人在QQ群里问到如何判断一个C++对象是否在堆栈上, 我在网上搜索了下, 搜到这个么一个CSDN的帖子http://topic.csdn.net/t/20060124/10/4532966. ...
- IOS上解决内存越界访问问题
IOS经常会混合使用C代码,而在C中,对内存的读写是很频繁的操作. 其中,内存越界读写 unsigned char* p =(unsigned char*)malloc(10); unsigned c ...
- 32位Windows7上8G内存使用感受+xp 32位下使用8G内存 (转)
32位Windows7上8G内存使用感受+xp 32位下使用8G内存 博客分类: Windows XPWindowsIE企业应用软件测试 我推荐做开发的朋友:赶快加入8G的行列吧....呵呵..超爽 ...
- 垃圾回收GC:.Net自己主动内存管理 上(一)内存分配
垃圾回收GC:.Net自己主动内存管理 上(一)内存分配 垃圾回收GC:.Net自己主动内存管理 上(一)内存分配 垃圾回收GC:.Net自己主动内存管理 上(二)内存算法 垃圾回收GC:.Net自己 ...
- STM32片上Flash内存映射、页面大小、寄存器映射
STM32片上Flash内存映射.页面大小.寄存器映射 STM32有4种Flash module organization,分别是:low-density devices(32KB,1KB/page) ...
- SQL Server 在Alwayson上使用内存表"踩坑"
200 ? "200px" : this.width)!important;} --> 介绍 因为线上alwayson环境的一个数据库上使用内存表.经过大概一个星期监控程序发 ...
- 如何在Linux上清理内存缓存、缓冲与交换空间
如何在Linux上清理内存缓存.缓冲与交换空间 与其他类型的操作系统一样,GNU/Linux已经有效的实现了内存管理,甚至更加优秀.但是如果任何进程正在吃光你的内存,并且你想清理它,Linux提供了一 ...
- 线上服务内存OOM问题定位[转自58沈剑]
相信大家都有感触,线上服务内存OOM的问题,是最难定位的问题,不过归根结底,最常见的原因: 本身资源不够 申请的太多 资源耗尽 58到家架构部,运维部,58速运技术部联合进行了一次线上服务内存OOM问 ...
- Unix系统编程()在堆上分配内存
在堆上分配内存:malloc和free 一般情况下,C程序使用malloc函数族在堆上分配和释放内存.较之brk和sbrk,这些函数具备不少优点: 属于C语言标准的一部分 更易于在多线程程序中使用 接 ...
随机推荐
- 在form action中滥用绝对路径导致session的attribute丢失(无法正常保存)
症状: 刚才在做一个利用session的attribute保存用户的id的实验,login.jsp输入用户id,提交给LoginServlet去数据库验证,然后LoginServlet根据验证情况跳转 ...
- 基于jQuery的图片异步加载和预加载实例
如今的网页中有很多图片,比如相册列表,那么如果一次性读取图片将会瞬间加重服务器的负担,所以我们用jQuery来实现图片的异步加载和预加载功能,这样在页面的可视范围内才会加载图片,当拖动页面至可视界面时 ...
- ubuntu server执行sudo出现"no talloc stackframe at ../source3/param/loadparm.c:4864, leaking memory"
[Ubuntu] 執行 sudo 時,出現 "no talloc stackframe at ../source3/param/loadparm.c:4864, leaking memory ...
- UNION types numeric and text cannot be matched
NULL ::NUMERIC 有时候会遇到这个问题,那是因为几个SQL组合在一起的时候,同一个字段的值,出来了不同类型的时候,这种时候就需要进行转型的处理了.
- 知乎日报 API 分析
声明 下面全部 API 均由 知乎(Zhihu.Inc) 提供,本人採取非正常手段获取. 获取与共享之行为或有侵犯知乎权益的嫌疑.若被告知需停止共享与使用.本人会及时删除此页面与整个项目. 请您暸解相 ...
- CEF Xilium.CefGlue 在当前窗体中打开全部链接(防止弹窗)
我们在使用Xilium.CefGlue编写浏览器应用程序时.对于嵌入的网页假设有链接会在新窗体打开.这种用户体验会非常差.因此我们须要改动程序,使全部链接都在当前窗体中打开. 首先引用Xilium.C ...
- Unix系统编程()信号:概念和概述
这篇将一口气学完信号的基本概念,但是有很多的细节,所以篇幅较长,请做好心理准备. (他大爷的,一口气没有学完,太懒了) 有以下主题: 各种不同信号及其用途 内核可能为进程产生信号的环境,以及某一进程向 ...
- Python高级编程之生成器(Generator)与coroutine(一):Generator
转载请注明出处:点我 这是一系列的文章,会从基础开始一步步的介绍Python中的Generator以及coroutine(协程)(主要是介绍coroutine),并且详细的讲述了Python中coro ...
- mvc 返回list数据 页面 mode
<%@ Page Language="C#" Inherits="System.Web.Mvc.ViewPage<IEnumerable<实体命名空间& ...
- html -- contenteditable 属性:指定元素内容是否可编辑
所有主流浏览器都支持 contenteditable 属性 定义和用法 contenteditable 属性指定元素内容是否可编辑. 注意: 当元素中没有设置 contenteditable 属性时, ...