通过分析源码可以更好理解List<T>的工作方式，帮助我们写出更稳定的代码。

List<T>源码地址: https://github.com/dotnet/corefx/blob/master/src/System.Collections/src/System/Collections/Generic/List.cs。

接口

List<T>实现的接口：IList<T>, IList, IReadOnlyList<T>

其实.net framework经过多代发展，List的接口确实是有点多了，添加新功能时为了兼容老功能，一些旧的接口又不能丢掉，所以看上去有点复杂。先把这些接口捋一下：

IEnumerator是枚举器接口，拥有枚举元素的功能，成员有Current, MoveNext, Reset，这三个函数可以使集合支持遍历。

IEnumerable是支持枚举接口，实现这接口表示支持遍历，成员就是上面的IEnumerator。

ICollection是集合接口，支持着集合的Count属性和CopyTo操作，另外还有同步的属性IsSynchronized（判断是否线程安全）和SyncRoot（lock的对象）。

IList是集合的操作接口，支持索引器，Add, Remove, Insert, Contains等操作。

泛型部分基本是上面这些接口的泛型实现，不过IList<T>的一些操作放到ICollection<T>里了，可能微软也觉得对于集合的一些操作放到ICollection更合理吧。

IReadOnlyCollection<T>是.net 4.5加进来的，可以认为是IList<T>的只读版。

变量

 private const int _defaultCapacity = ;

 private T[] _items;

 private int _size;

 private int _version;

 private Object _syncRoot;

 static readonly T[] _emptyArray = new T[];

_defaultCapacity意思是new List<T>时默认大小是4。

_items就是存List<T>元素的数组了，List<T>也是基于数组实现的。

_size指元素个数。

_version看字面意思是版本，具体用处下面看，与遍历集合时经常碰到的集合被修改异常有关。

_syncRoot上面有说到，内置的用于lock的对象，如果在多线程时只是操作这个集合就可以lock这个来保证线程安全，当然一般来说这个是内部用的，虽然对List<T>本身来说没什么用，这个不取的话是不会把对象new出来的，对于锁我们更常用的是在外面new一个readonly的object。

emptyArray这是个静态只读的空数组，所有没有元素的List<T>都是用这个，所以两个List<int>的_items其实是一样的，都是这个_emptyArray。

构造函数

有三个构造函数

 public List()

 {

     _items = _emptyArray;

 }

最常用的，_items直接指向静态空数组。

 public List(int capacity)

 {

     if (capacity < ) throw new ArgumentOutOfRangeException(nameof(capacity), capacity, SR.ArgumentOutOfRange_NeedNonNegNum);

     Contract.EndContractBlock();

     if (capacity == )

         _items = _emptyArray;

     else

         _items = new T[capacity];

 }

可以通过capacity指定大小

 public List(IEnumerable<T> collection)

 {

     if (collection == null)

         throw new ArgumentNullException(nameof(collection));

     Contract.EndContractBlock();

     ICollection<T> c = collection as ICollection<T>;

     if (c != null)

     {

         int count = c.Count;

         if (count == )

         {

             _items = _emptyArray;

         }

         else

         {

             _items = new T[count];

             c.CopyTo(_items, );

             _size = count;

         }

     }

     else

     {

         _size = ;

         _items = _emptyArray;

         // This enumerable could be empty.  Let Add allocate a new array, if needed.

         // Note it will also go to _defaultCapacity first, not 1, then 2, etc.

         using (IEnumerator<T> en = collection.GetEnumerator())

         {

             while (en.MoveNext())

             {

                 Add(en.Current);

             }

         }

     }

 }

初始添加一个集合，先看是否是ICollection，看上面知道这个接口有Copy的功能，copy到_items里。如果不是ICollection，不过由于是IEnumerable，所以可以遍历，一个一个加到_items里。

属性

Count 返回的是_size，这个是元素的实际个数，不是数组大小。

IsSynchronized是false，表示并非用SyncRoot 来实现同步。List<T>不是线程安全，需要我们自己用锁搞定，

IsReadOnly也是false, 那为什么要继承IReadOnlyList<T>呢，是为了提供一个转换成只读List的机会，比如有的方法不希望传进来的List可以修改，就可以把参数设成IReadOnlyList。

 Object System.Collections.ICollection.SyncRoot

 {

     get

     {

         if (_syncRoot == null)

         {

             System.Threading.Interlocked.CompareExchange<Object>(ref _syncRoot, new Object(), null);

         }

         return _syncRoot;

     }

 }

SyncRoot通过原子操作得到一个对象，对于List<T>来说并没有用，对于某些集合比较有用，比如SyncHashtable，就是通过syncRoot来实现线程安全。

比较重要的Capacity:

 public int Capacity

 {

     get

     {

         Contract.Ensures(Contract.Result<int>() >= );

         return _items.Length;

     }

     set

     {

         if (value < _size)

         {

             throw new ArgumentOutOfRangeException(nameof(value), value, SR.ArgumentOutOfRange_SmallCapacity);

         }

         Contract.EndContractBlock();

         if (value != _items.Length)

         {

             if (value > )

             {

                 var items = new T[value];

                 Array.Copy(_items, , items, , _size);

                 _items = items;

             }

             else

             {

                 _items = _emptyArray;

             }

         }

     }

 }

Capacity取的就是数组的长度，另外我们可以通过Capacity给List设置大小，即使这个List里面已经有元素，会先new一个目标大小的数组，然后通过Array.Copy把现有元素复制到新数组里。但一般情况下这些不用我们设置Capacity，添加新元素时发现长度不够会自动扩大数组。Capacity是int型，说明最大是int.MaxValue，大约2G个，如果我们直接给List设置int.MaxValue就要看你的内存够不够2G*4也就是8G了，不够的话会报OutofMemory Exception。其实个人觉得这里Capacity用uint是不是更好。

用100M个，内存占用400M多

同样100M个，由于是long，内存占了800M多

方法

看几个重要的方法：

 public void Add(T item)

 {

     if (_size == _items.Length) EnsureCapacity(_size + );

     _items[_size++] = item;

     _version++;

 }

当前数组大小和元素个数相等时表明再Add的话大小不够了，需要先通过EnsureCapacity扩容, _size+1指明了一个最小的扩容目标。

 private void EnsureCapacity(int min)

 {

     if (_items.Length < min)

     {

         int newCapacity = _items.Length ==  ? _defaultCapacity : _items.Length * ;

         // Allow the list to grow to maximum possible capacity (~2G elements) before encountering overflow.

         // Note that this check works even when _items.Length overflowed thanks to the (uint) cast

         //if ((uint)newCapacity > Array.MaxArrayLength) newCapacity = Array.MaxArrayLength;

         if (newCapacity < min) newCapacity = min;

         Capacity = newCapacity;

     }

 }

扩容方法，如果数组长度是0的话则用_defaultCapacity也就是4来做为数组长度，否则则以当前元素个数的2倍去扩大。如果新得到的长度比传进来的min小的话则就用min，也就是选大的，这种情况在InsertRange时有可能发生，因为insert的list很可能比当前list的元素个数多。

Add函数里还有个_version++，这个_version可以在很多方法里看到，如remove, insert, sort等，但凡要修改集合都需要_version++。那这个_version有什么用呢？

 public void ForEach(Action<T> action)

 {

     if (action == null)

     {

         throw new ArgumentNullException(nameof(action));

     }

     int version = _version;

     for (int i = ; i < _size; i++)

     {

         if (version != _version)

         {

             break;

         }

         action(_items[i]);

     }

     if (version != _version)

         throw new InvalidOperationException(SR.InvalidOperation_EnumFailedVersion);

 }

在遍历时如果发现_version变了立即退出并抛出遍历过程集合被修改异常，比如在foreach里remove或add元素就会导致这个异常。更常见的是出现在多线程时一个线程遍历集合，另一个线程修改集合的时候，相信很多人吃过苦头。

如果一个线程时想在遍历时修改集合，比如删除，可以用原始的for(int i=list.Count-1;i>=0;i--)方式。

另外用到version还有枚举器Enumerator，MoveNext过程中同样会检测这个。

其他大部分方法都是通过Array的静态函数实现，不多说，需要注意的是List<T>继承自IList，所以可以转成IList，转之后泛型就没了，如果是List<int>，转成IList的话和IList<object>没什么两样，装拆箱带来的性能损失也值得注意。

总结

List<T>初始大小是4，自动扩容是以当前数组元素的两倍或InsertRange目标list的元素个数来扩容（哪个大选哪个）。如果有比较确定的大小可以考虑提前设置，因为每次自动扩容需要重新分配数组和copy元素，性能损耗不小。

List<T>通过version来跟踪集合是否发生改变，如果在foreach遍历时发生改变则抛出异常。

List<T>并非线程安全，任何使用的时候都要考虑当前环境是否可能有多线程存在，是否需要用锁来保证集合线程安全。

.net源码分析 – List<T>的更多相关文章

ABP源码分析一：整体项目结构及目录
ABP是一套非常优秀的web应用程序架构,适合用来搭建集中式架构的web应用程序. 整个Abp的Infrastructure是以Abp这个package为核心模块(core)+15个模块(module ...
HashMap与TreeMap源码分析
1. 引言在红黑树--算法导论(15)中学习了红黑树的原理.本来打算自己来试着实现一下,然而在看了JDK(1.8.0)TreeMap的源码后恍然发现原来它就是利用红黑树实现的(很惭愧学了Ja ...
nginx源码分析之网络初始化
nginx作为一个高性能的HTTP服务器,网络的处理是其核心,了解网络的初始化有助于加深对nginx网络处理的了解,本文主要通过nginx的源代码来分析其网络初始化. 从配置文件中读取初始化信息与网 ...
zookeeper源码分析之五服务端(集群leader)处理请求流程
leader的实现类为LeaderZooKeeperServer,它间接继承自标准ZookeeperServer.它规定了请求到达leader时需要经历的路径: PrepRequestProcesso ...
zookeeper源码分析之四服务端(单机)处理请求流程
上文: zookeeper源码分析之一服务端启动过程中,我们介绍了zookeeper服务器的启动过程,其中单机是ZookeeperServer启动,集群使用QuorumPeer启动,那么这次我们分析 ...
zookeeper源码分析之三客户端发送请求流程
znode 可以被监控,包括这个目录节点中存储的数据的修改,子节点目录的变化等,一旦变化可以通知设置监控的客户端,这个功能是zookeeper对于应用最重要的特性,通过这个特性可以实现的功能包括配置的 ...
java使用websocket，并且获取HttpSession，源码分析
转载请在页首注明作者与出处 http://www.cnblogs.com/zhuxiaojie/p/6238826.html 一:本文使用范围此文不仅仅局限于spring boot,普通的sprin ...
ABP源码分析二：ABP中配置的注册和初始化
一般来说,ASP.NET Web应用程序的第一个执行的方法是Global.asax下定义的Start方法.执行这个方法前HttpApplication 实例必须存在,也就是说其构造函数的执行必然是完成 ...
ABP源码分析三：ABP Module
Abp是一种基于模块化设计的思想构建的.开发人员可以将自定义的功能以模块(module)的形式集成到ABP中.具体的功能都可以设计成一个单独的Module.Abp底层框架提供便捷的方法集成每个Modu ...
ABP源码分析四：Configuration
核心模块的配置 Configuration是ABP中设计比较巧妙的地方.其通过AbpStartupConfiguration,Castle的依赖注入,Dictionary对象和扩展方法很巧妙的实现了配 ...

随机推荐

飞流直下的精彩 -- 淘宝UWP中瀑布流列表的实现
在淘宝UWP中,搜索结果列表是用户了解宝贝的重要一环,其中的图片效果对吸引用户点击搜索结果,查看宝贝详情有比较大的影响.为此手机淘宝特意在搜索结果列表上采用了2种表现方式:一种就是普通的列表模式,而另 ...
基于zookeeper实现统一资源管理
分布式系统中经常涉及到配置资源的管理,比如,一个应用系统需要部署在多台服务器上,但是他们拥有某些的配置项是相同的,如果配置变更,需要修改这些配置,那么需要同时修改每台服务器,这样做比较麻烦而且容易出错 ...
MySQL MMM高可用方案
200 ? "200px" : this.width)!important;} --> 介绍本篇文章主要介绍搭建MMM方案以及MMM架构的原理.这里不介绍主从.主主的搭建方 ...
在VMWare中建立Hadoop虚拟集群的详细步骤（使用CentOS）
最近在学习Hadoop,于是想使用VMWare建立一个虚拟的集群环境.网上有很多参考资料,但参照其步骤进行设置时却还是遇到了不少问题,所以在这里详细写一下我的配置过程,以及其中遇到的问题及相应的解决方 ...
提供程序不支持 DatabaseExists
如果Oracle CodeFirst模式下要用EFProviderWrapperToolkit,那么会报告以下错误: 提供程序不支持 DatabaseExists. 这个错误是因为Oracle Cod ...
Html5 绘制五星红旗
Html5+JavaScript 在Canvas上绘制五星红旗,具体思路如下图所示: 绘制思路在上图中已有说明,具体代码如下: <script type="text/javascrip ...
单独使用jdbc编程问题总结（一）
在学习Mybatis之前,我们先来回顾JDBC编程的相关知识.在此基础上深入的学习Mybatis框架.如有错误,敬请指正. (一)首先我们既然要使用jdbc,当然是要操作数据库了.创建一个名为:myb ...
appledoc 使用brew命令安装使用
appledoc --project-name yushuyi12345677 --project-company "xiaoyu123" --company-id aaaa -- ...
PHP钩子机制
什么是钩子大家想必听过插件,wordpress插件特别多,这个就是用钩子机制实现的. 当代码在运行的过程中,我们预先在运行的几个特殊点里执行一些特殊方法:例如在运行方法(例如Blog::add的ad ...
Oozie 快速入门
设想一下,当你的系统引入了spark或者hadoop以后,基于Spark和Hadoop已经做了一些任务,比如一连串的Map Reduce任务,但是他们之间彼此右前后依赖的顺序,因此你必须要等一个任务执 ...

.net源码分析 – List<T>

接口

变量

构造函数

属性

方法

总结

.net源码分析 – List<T>的更多相关文章

随机推荐

热门专题