在C#中string关键字的映射实际上指向.NET基类System.String。System.String是一个功能非常强大且用途非常广泛的基类,所以我们在用C#string的时候实际就是在用.NET Framework String。String上是一个不可变的数据类型,一旦对字符串对象进行了初始化,该字符串对象就不能改变了。表面上修改字符串内容的方法和运算符实际上创建一个新字符串,所以重复修改给定的字符串,效率会很低。所以.Net Framework定义了另一个StringBuild类以提高字符串处理的性能,但String和StringBuild之间又有什么联系呢。

以下一个示例基于版本.Net Framework2.0这个示例主要是参考重谈字符串性能,先定义一个简单性能计数器主要目的有:

(1)打印出各字符串处理方法的消耗时间

(2)CPU时钟周期

(3)执行过程中垃圾回收器回收次数

 public class CodeTimer
{
public delegate void Action();
/// <summary>
/// 初始化
/// </summary>
public static void Initialize()
{
Process.GetCurrentProcess().PriorityClass = ProcessPriorityClass.High;
Thread.CurrentThread.Priority = ThreadPriority.Highest;
Time("", , () => { });
}
public static void Time(string name, int iteration, Action action)
{
if (String.IsNullOrEmpty(name)) return; // 1.
ConsoleColor currentForeColor = Console.ForegroundColor;
Console.ForegroundColor = ConsoleColor.Yellow;
Console.WriteLine(name); // 2.
GC.Collect(GC.MaxGeneration, GCCollectionMode.Forced);
int[] gcCounts = new int[GC.MaxGeneration + ];
for (int i = ; i <= GC.MaxGeneration; i++)
{
gcCounts[i] = GC.CollectionCount(i);
} // 3.
Stopwatch watch = new Stopwatch();
watch.Start();
ulong cycleCount = GetCycleCount();
for (int i = ; i < iteration; i++) action();
ulong cpuCycles = GetCycleCount() - cycleCount;
watch.Stop(); // 4.
Console.ForegroundColor = currentForeColor;
Console.WriteLine("\tTime Elapsed:\t" + watch.ElapsedMilliseconds.ToString("N0") + "ms");
Console.WriteLine("\tCPU Cycles:\t" + cpuCycles.ToString("N0")); // 5.
for (int i = ; i <= GC.MaxGeneration; i++)
{
int count = GC.CollectionCount(i) - gcCounts[i];
Console.WriteLine("\tGen " + i + ": \t\t" + count);
} Console.WriteLine();
} private static ulong GetCycleCount()
{
ulong cycleCount = ;
QueryThreadCycleTime(GetCurrentThread(), ref cycleCount);
return cycleCount;
} [DllImport("kernel32.dll")]
[return: MarshalAs(UnmanagedType.Bool)]
static extern bool QueryThreadCycleTime(IntPtr threadHandle, ref ulong cycleTime); [DllImport("kernel32.dll")]
static extern IntPtr GetCurrentThread();
}

原文链接:一个简单的性能计数器:CodeTimer

定义一个StringListBuilder用List<string>先将所有字符串保存起来最后转化为字符串数组,再返回字符串

public class StringListBuilder
{
private List<string> m_list = new List<string>(); public StringListBuilder Append(string s)
{
this.m_list.Add(s);
return this;
} public override string ToString()
{
return String.Concat(this.m_list.ToArray());
}
}

定义一个StrPerformance类用于维护各个字符串处理的方法

 public class StrPerformance
{
private static readonly string STR = ""; public static string NormalConcat(int count)
{
var result = "";
for (int i = ; i < count; i++) result += STR;
return result;
} public static string StringBuilder(int count)
{
var builder = new StringBuilder();
for (int i = ; i < count; i++) builder.Append(STR);
return builder.ToString();
} public static string StringListBuilder(int count)
{
var builder = new StringListBuilder();
for (int i = ; i < count; i++) builder.Append(STR);
return builder.ToString();
} public static string StringConcat(int count)
{
var array = new string[count];
for (int i = ; i < count; i++) array[i] = STR;
return String.Concat(array);
}
}

用性能计数器记录各个方法执行过程并且打印出对应的参数

CodeTimer.Initialize();

            for (int i = ; i <= 2048; i *= )
{
CodeTimer.Time(
String.Format("StringListBuilder ({0})", i),
,
() => StrPerformance.StringListBuilder(i)); CodeTimer.Time(
String.Format("String concat ({0})", i),
,
() => StrPerformance.StringConcat(i));
CodeTimer.Time(
String.Format("StringBuilder ({0})", i),
,
() => StrPerformance.StringBuilder(i)); }

分析可以得出,广受追捧的StringBuilder性能似乎并不是最好的,String.Concat方法有时候有时候更适合使用。那么为什么String.Concat方法性能那么高,StringBuilder反而比StringListBuilder要差,要知道StringListBuilder还要维护一个集合,通过反编译我们看一下.NET2.0的String.Concat和StringBuilder到底是怎么实现的。

先看在.Net2.0下StringBuilder的Append和ToString方法的实现过程,Append和ToString实现过程。

// System.Text.StringBuilder
public StringBuilder Append(string value)
{
if (value == null)
{
return this;
}
string text = this.m_StringValue;
IntPtr intPtr = Thread.InternalGetCurrentThread();
if (this.m_currentThread != intPtr)
{
text = string.GetStringForStringBuilder(text, text.Capacity);
}
int length = text.Length;
int requiredLength = length + value.Length;
if (this.NeedsAllocation(text, requiredLength))
{
string newString = this.GetNewString(text, requiredLength);
newString.AppendInPlace(value, length);
this.ReplaceString(intPtr, newString);
}
else
{
text.AppendInPlace(value, length);
this.ReplaceString(intPtr, text);
}
return this;
}
public override string ToString()
{
string currentValue = this.m_currentValue; if (this.m_currentThread != Thread.InternalGetCurrentThread())
{
return string.InternalCopy(currentValue);
} // 如果这个字符串对象“太空”的话
if (( * currentValue.Length) < currentValue.ArrayLength)
{
// 则构造一个“满当”地对象
return string.InternalCopy(currentValue);
} // 将字符序列最后放一个\0
currentValue.ClearPostNullChar(); // 既然容器已经“暴露”,则设制“当前线程”的标识为Zero,
// 这意味着下次操作会生成新字符串对象(即新的容器)
this.m_currentThread = IntPtr.Zero; // 如果“还不算太空”,则返回当前对象
return currentValue;
}

StringBuilder的ToString方法比较有意思,它会判断到底是“构造一个新对象”还是就“直接返回当前容器”给你。如果直接返回当前容器,则可能会浪费较多内存,而如果构造一个新对象,则又会损耗性能。让StringBuilder做出决定的便是容器内部的字符序列占“最大容积”的比例,如果超过一半,则表明“还不算太空”,便选择“时间”,直接返回容器;否则,StringBuilder会认为还是选择“空间”较为合算,便构造一个新对象并返回,至于当前的容器便会和StringBuilder一道被GC回收了。

同时我们可以看到,如果返回了新对象,则当前容器还可以继续在Append时使用,否则Append方法便会因为m_currentValue为Zero而创建新的容器。不过,从ToString的实现中也可以看出,多次调用ToString方法一定返回新建的对象。

而String.Concat又做了什么,String类Concat的具体实现过程

public static string Concat(params string[] values)
{
int totalLength = ; if (values == null)
{
throw new ArgumentNullException("values");
} string[] arrayToConcate = new string[values.Length]; // 遍历源数组,填充拼接用的数组
for (int i = ; i < values.Length; i++)
{
string str = values[i]; // null作为空字符串对待
arrayToConcate[i] = (str == null) ? Empty : str; // 累计字符串总长度
totalLength += arrayToConcate[i].Length; // 如果越界了,抛异常
if (totalLength < )
{
throw new OutOfMemoryException();
}
} // 拼接
return ConcatArray(arrayToConcate, totalLength);
}
[MethodImpl(MethodImplOptions.InternalCall)]
private static extern string FastAllocateString(int length); private static string ConcatArray(string[] values, int totalLength)
{
// 分配目标字符串所占用的空间(即创建对象)
string dest = FastAllocateString(totalLength); int destPos = ; for (int i = ; i < values.Length; i++)
{
// 不断将源字符串的每个元素填充至目标位置
FillStringChecked(dest, destPos, values[i]); // 偏移量不断更新
destPos += values[i].Length;
} return dest;
}
private static unsafe void FillStringChecked(string dest, int destPos, string src)
{
int length = src.Length;
if (length > (dest.Length - destPos))
{
throw new IndexOutOfRangeException();
} fixed (char* chDest = &dest.m_firstChar)
{
fixed (char* chSrc = &src.m_firstChar)
{
wstrcpy(chDest + destPos, chSrc, length);
}
}
}

由于数组中的字符串都是确定的因此事先计算出结果的长度,于是遍历源字符串数组,将它们一个一个复制(或叫做“填充”)到目标字符串的某一段位置上去,因为在此之前已经确定结果的大小,因此直接创建一个“容器”即可,剩下的只是填充数据而已。既然可以不浪费任何一寸空间,也没有任何多余的操作,这也是String.Concat高效的原因。

同样的代码移植到.Net 4.5上会不会还像之前一样String.Concat在处理连接字符串中性能最高

这次StringBuilder又重新回到了我们最初的印象中,在处理多字符串连接的时候StringBuilder是性能最高的,通过和.Net 2.0的实验结果来看StringListBuilder和String Concat的性能变化不大,而似乎StringBuilder的性能提高了一倍,那么在.NET 4.5中StringBuilder的Append方法又做了什么呢,下面我们来看一下.Net 4.5中Append的具体实现过程

 public unsafe StringBuilder Append(string value)
{
if (value != null)
{
//StringBuilder内维护的一个字符数组
char[] chunkChars = this.m_ChunkChars;
int chunkLength = this.m_ChunkLength;
int length = value.Length;
int num = chunkLength + length; //不必增加m_ChunkChars字符数组的长度
if (num < chunkChars.Length)
{
if (length <= )
{
if (length > )
{
chunkChars[chunkLength] = value[];
}
if (length > )
{
chunkChars[chunkLength + ] = value[];
}
}
else
{
fixed (string text = value)
{
char* ptr = text;
if (ptr != null)
{
ptr += RuntimeHelpers.OffsetToStringData / ;
}
fixed (char* ptr2 = &chunkChars[chunkLength])
{
string.wstrcpy(ptr2, ptr, length);
}
}
}
this.m_ChunkLength = num;
}
//增加m_ChunkChars数组的长度
else
{
this.AppendHelper(value);
}
}
return this;
}
 private unsafe void AppendHelper(string value)
{
fixed (string text = value)
{
//去字符串的地址
char* ptr = text;
if (ptr != null)
{
ptr += RuntimeHelpers.OffsetToStringData / ;
}
this.Append(ptr, value.Length);
}
} public unsafe StringBuilder Append(char* value, int valueCount)
{
if (valueCount < )
{
throw new ArgumentOutOfRangeException("valueCount", Environment.GetResourceString("ArgumentOutOfRange_NegativeCount"));
}
int num = valueCount + this.m_ChunkLength;
if (num <= this.m_ChunkChars.Length)
{
//把字符串一个一个复制到m_ChunkChars字符数组中
StringBuilder.ThreadSafeCopy(value, this.m_ChunkChars, this.m_ChunkLength, valueCount);
this.m_ChunkLength = num;
}
else
{
int num2 = this.m_ChunkChars.Length - this.m_ChunkLength;
if (num2 > )
{
StringBuilder.ThreadSafeCopy(value, this.m_ChunkChars, this.m_ChunkLength, num2);
this.m_ChunkLength = this.m_ChunkChars.Length;
}
int num3 = valueCount - num2;
this.ExpandByABlock(num3);
StringBuilder.ThreadSafeCopy(value + num2, this.m_ChunkChars, , num3);
this.m_ChunkLength = num3;
}
return this;
}

在分析代码可知在.Net 4.5StringBuilder中内部维护了一个m_ChunkChars字符数组,来避免不断扩容,不断复制的过程所造成的性能消耗,所以StringBuilder性能又成为三者中最高的一个。

看了老赵blog之后,(此处省去一千溢美之词)——只想说一句:“我对阁下的景仰有如滔滔江水,连绵不绝,又如黄河泛滥,一发而不可收拾!

从.Net版本演变看String和StringBuilder性能之争的更多相关文章

  1. 从.Net版本演变看String和StringBuild性能之争

    在C#中string关键字的映射实际上指向.NET基类System.String.System.String是一个功能非常强大且用途非常广泛的基类,所以我们在用C#string的时候实际就是在用.NE ...

  2. 从源码看String,StringBuffer,StringBuilder的区别

    前言 看了一篇文章,大概是讲面试中的java基础的,有如题这么个面试题.我又翻了一些文章看了下,然后去看源码.看一下源码大概能更加了解一些. String String类是final的,表示不可被继承 ...

  3. 探秘Java中的String、StringBuilder以及StringBuffer

    探秘Java中String.StringBuilder以及StringBuffer 相信String这个类是Java中使用得最频繁的类之一,并且又是各大公司面试喜欢问 到的地方,今天就来和大家一起学习 ...

  4. 探秘Java中String、StringBuilder以及StringBuffer

    探秘Java中String.StringBuilder以及StringBuffer 相信String这个类是Java中使用得最频繁的类之一,并且又是各大公司面试喜欢问 到的地方,今天就来和大家一起学习 ...

  5. Java中String、StringBuilder以及StringBuffer

    原文出处: 海子 相信String这个类是Java中使用得最频繁的类之一,并且又是各大公司面试喜欢问到的地方,今天就来和大家一起学习一下String.StringBuilder和StringBuffe ...

  6. String,StringBuffer,StringBuilder的区别及其源码分析

    String,StringBuffer,StringBuilder的区别这个问题几乎是面试必问的题,这里做了一些总结: 1.先来分析一下这三个类之间的关系 乍一看它们都是用于处理字符串的java类,而 ...

  7. Java基础 -- String,StringBuilder,StringBuffer三者的区别

    结论 1-String,StringBuilder,StringBuffer 之间的区别主要是在两个方面,即运行速度和线程安全这两方面: 首先说运行速度,或者说是执行速度,在这方面运行速度快慢为:St ...

  8. 转发: 探秘Java中的String、StringBuilder以及StringBuffer

    原文地址 探秘Java中String.StringBuilder以及StringBuffer 相信String这个类是Java中使用得最频繁的类之一,并且又是各大公司面试喜欢问到的地方,今天就来和大家 ...

  9. 探秘Java中的String、StringBuilder以及StringBuffer(转载)

    探秘Java中String.StringBuilder以及StringBuffer 相信String这个类是Java中使用得最频繁的类之一,并且又是各大公司面试喜欢问到的地方,今天就来和大家一起学习一 ...

随机推荐

  1. GET 方法和 POST方法区别

    两种 HTTP 请求方法:GET 和 POST 在客户机和服务器之间进行请求-响应时,两种最常被用到的方法是:GET 和 POST. GET - 从指定的资源请求数据. POST - 向指定的资源提交 ...

  2. Python第三方库之openpyxl(6)

    Python第三方库之openpyxl(6) 折线图 折线图允许在固定轴上绘制数据,它们类似于散列图,主要的区别在于,在折线图中,每个数据序列都是根据相同的值绘制的,不同的轴可以用于辅助轴,与条形图类 ...

  3. matlab调用自己写的函数时报错: reference to a cleared variable

    原因是在自己写的函数中加了clear. 解决办法:自己定义的函数中不能加clear,可以加clc;

  4. 凌乱的桌子和与 Web 的设计理念说明

    Python是一门脚本语言,因为能将其他各种编程语言写的模块粘接在一起,也被称作胶水语言.强大的包容性.强悍的功能和应用的广泛性使其受到越来越多的关注,想起一句老话:你若盛开,蝴蝶自来. 如果你感觉学 ...

  5. BZOJ 1875 [SDOI2009]HH去散步 ——动态规划 矩阵乘法

    发现t非常大,所以大概就是快速幂一类的问题了, 然后根据k^3logn算了算,发现k大约是边数的时候复杂度比较合适. 发现比较麻烦的就是前驱的记录,所以直接把边看做点,不能走反向边,但是可以走重边,然 ...

  6. 刷题总结——art2(ssoj)

    题目: 题解: o(n)复杂度扫一遍再用一个stack维护就可以了·····mdzz这道题都不会做·· 代码: #include<iostream> #include<cstdio& ...

  7. 算法复习——拓展欧几里得(poj1061)

    题目: Description 两只青蛙在网上相识了,它们聊得很开心,于是觉得很有必要见一面.它们很高兴地发现它们住在同一条纬度线上,于是它们约定各自朝西跳,直到碰面为止.可是它们出发之前忘记了一件很 ...

  8. sublime text3安装angularjs插件

    sublime能够支持AngularJS开发那绝对是一件很爽的事情.下面我一步步讲解如何为sublime安装AngularJS插件. 首先提供一个破解版的sublime text 3的下载地址:htt ...

  9. python和scrapy的安装【转:https://my.oschina.net/xtfjt1988/blog/364577】

    抓取网站的代码实现很多,如果考虑到抓取下载大量内容scrapy框架无疑是一个很好的工具.Scrapy = Search+Pyton.下面简单列出安装过程.PS:一定要按照Python的版本下载,要不然 ...

  10. 还是Tomcat,关于类加载器的趣味实验

    一.前言 类加载器,其实是很复杂一个东西,想等到我完全什么都弄明白了再写出来,估计不太现实...现在只能是知道多少写多少吧. 首先,我提一个问题:在我们自己的servlet中(比如ssm中,contr ...