聊聊 dotnet 7 对 bool 与字符串互转的底层性能优化
本文也叫 跟着 Stephen Toub 大佬学性能优化系列。大家都知道在 .NET 7 有众多的性能优化,其中就包括了对布尔和字符串互转的性能优化。在对布尔和字符串的转换的性能优化上,有着非常巧妙的思路,值得写篇博客记录
在 Performance Improvements in .NET 7 - .NET Blog 这篇官方开发博客里面提到了 dotnet 7 的各个方面的性能优化,其中就包括了本身的主角,对 bool 与 string 互转的性能优化。此优化的核心实现代码请参阅 https://github.com/dotnet/runtime/pull/64782
在将 "True"
和 "False"
字符串和 bool 布尔互相转换时,假定不使用框架内置的转换方法,那将会如何做呢? 先从字符串转到布尔开始
开始转换的第一步可以通过字符串的长度进行快速的判断。例如无论是 "True"
还是 "False"
字符串,字符的长度都一定是大于 3 的,因此第一步可以尝试判断一下,是否大于 3 个字符。如果这一条不满足,那肯定不能作为布尔的转换字符串了。如果刚好等于 4 个字符长度,那也许就是 "True"
字符串了
转换字符串为布尔时,将无视字符串的大小写,人类方便理解的一个版本如下
internal static bool IsTrueStringIgnoreCase(ReadOnlySpan<char> value)
{
return value.Length == 4 &&
(value[0] == 't' || value[0] == 'T') &&
(value[1] == 'r' || value[1] == 'R') &&
(value[2] == 'u' || value[2] == 'U') &&
(value[3] == 'e' || value[3] == 'E');
}
没错,就是每个字符串都判断一下。刚好这就是 dotnet 6 所采用的转换方法。同理,判断 "False"
也是类似的代码逻辑
internal static bool IsFalseStringIgnoreCase(ReadOnlySpan<char> value)
{
return value.Length == 5 &&
(value[0] == 'f' || value[0] == 'F') &&
(value[1] == 'a' || value[1] == 'A') &&
(value[2] == 'l' || value[2] == 'L') &&
(value[3] == 's' || value[3] == 'S') &&
(value[4] == 'e' || value[4] == 'E');
}
假定要对以上的代码进行性能优化,可以怎么做呢?似乎我想不到有什么方法
在阅读了 Stephen Toub 大佬的优化,我才了解到原来还有如此的新思路,通过编码的方式进行优化。刚好的是在 C# 里面字符串的内存存储编码采用的是 Utf16 编码,采用 UTF16 编码的好处在于任意字符所在的内存的偏移量是可以完全瞬时确定的,可以快速和二进制进行映射从而提供更多优化的方向,例如刚好一个 UInt64 也就是一个 ulong 的长度就等于 4 个字符。而刚好 "True"
字符串就是 4 个字符
同样感谢远古的 ASCII 编码的定义的超级大佬,英文的大小写转换只需要取一个 0x20 的或即可让字符转换为小写,无论之前的字符是大写还是小写。于是先对输入的字符串内容,从字符串取其中前 4 个字符,转换为 UInt64 的数据,转换方法如下
internal static bool IsTrueStringIgnoreCase(ReadOnlySpan<char> value)
{
var theUInt64Value = BinaryPrimitives.ReadUInt64LittleEndian(MemoryMarshal.AsBytes(value));
// 忽略代码
}
通过 MemoryMarshal.AsBytes 方法,快速将 value 映射为 byte 数组,这里必须说明的是,通过 MemoryMarshal.AsBytes 方法是做内存映射而不是一个转换的过程,这是非常快速且安全的一个过程。接着调用 BinaryPrimitives.ReadUInt64LittleEndian 方法转换为 UInt64 的数据
根据上文的 ASCII 编码规则,为了方便判断逻辑,将转换的结果全部转换为小写的内容,转换方法是使用 或
对每个字符进行 或
逻辑,代码如下
var caseValue = theUInt64Value | 0x0020002000200020;
由于字符使用 UTF16 编码,需要每个使用 0x0020
进行 或
逻辑,连起来就是 0020_0020_0020_0020
的数值
接着将 true
字符串转换为 UInt64 数据,转换之后的常量的编码是 0x65007500720074 这个数字。刚好进行一次 UInt64 判断即可,耗时可以被忽略
return caseValue == 0x65007500720074
干掉这些变量,连成一句代码,最终的代码如下
internal static bool IsTrueStringIgnoreCase(ReadOnlySpan<char> value) =>
value.Length == 4 &&
(BinaryPrimitives.ReadUInt64LittleEndian(MemoryMarshal.AsBytes(value)) | 0x0020002000200020) == 0x65007500720074; // "true" as a ulong, each char |'d with 0x0020 for case-insensitivity
以上代码的 =>
是替换原本的方法体的简写代码,原本的代码里面,方法是使用 {}
组织方法体代码。在新 C# 里面,如果方法体的代码只有一句话,那就和辣么大一样,用箭头的方式即可,如此可以让代码更加简短,同时方便淘汰那些落后的开发者
同理对 "False"
字符串也进行相同的处理。嗯,对于我这个学渣来说,最怕看到“同理”这两个字,因为我拿出脚趾都算不出来,好像 "False"
字符串有五个字符吧,大家算算看
那既然有五个字符,这就意味着不能整个字符串转换为 UInt64 了,毕竟 5 x 16 > 64
了,那咋办呢?没关系,先取 "False"
字符串前面的 "Fals"
字符出来,按照上文的方式进行比较,最后再比较 e
这个字符好了
internal static bool IsFalseStringIgnoreCase(ReadOnlySpan<char> value) =>
value.Length == 5 &&
(((BinaryPrimitives.ReadUInt64LittleEndian(MemoryMarshal.AsBytes(value)) | 0x0020002000200020) == 0x73006C00610066) & // "fals" as a ulong, each char |'d with 0x0020 for case-insensitivity
((value[4] | 0x20) == 'e'));
这能提升多少呢?非常多。大佬的基准测试如下,可以看到在 .NET 7 的耗时,接近是 .NET 6 的三分之一,优化特别大
Method | Runtime | Mean | Ratio |
---|---|---|---|
ParseTrue | .NET 6.0 | 7.347 ns | 1.00 |
ParseTrue | .NET 7.0 | 2.327 ns | 0.32 |
在从字符串转换,可以使用整数对比和转换的方法提升性能,那转换为字符串呢?其实也相同,也可以使用相同的方法。嗯,又是同理。同理,在将布尔转换为字符串时,可以通过写入整数的方式提升性能
例如将 true 写为 "True"
字符串,原本的写入采用的是如下的方法
public bool TryFormat(Span<char> destination, out int charsWritten)
{
// 这里的 m_value 就是实际存储的字段的值,表示当前的布尔值
// 这里传入的 destination 则是一段需要被写入的字符内容,咱这个函数就是需要在
// 传入的 destination 里将布尔值作为 True 或 False 字符串写入
// 写入成功返回 true 的值,且记录 charsWritten 说明写入了多少个字符了
///写入失败,返回 false 的值
if (m_value)
{
// 在这里需要写入 "True" 字符串到 destination 里
if ((uint)destination.Length > 3) // 如果长度都还没达到能写入 "True" 字符串的最小所需空间,那就不干活了
{
destination[0] = 'T';
destination[1] = 'r';
destination[2] = 'u';
destination[3] = 'e';
charsWritten = 4;
return true;
}
}
}
上面的代码也看到起来非常方便理解。在了解了可以使用整数的方式提升性能之后,试试换成使用整数赋值的方式,更改之后的代码如下
public bool TryFormat(Span<char> destination, out int charsWritten)
{
// 这里的 m_value 就是实际存储的字段的值,表示当前的布尔值
// 这里传入的 destination 则是一段需要被写入的字符内容,咱这个函数就是需要在
// 传入的 destination 里将布尔值作为 True 或 False 字符串写入
// 写入成功返回 true 的值,且记录 charsWritten 说明写入了多少个字符了
///写入失败,返回 false 的值
if (m_value)
{
// 在这里需要写入 "True" 字符串到 destination 里
if ((uint)destination.Length > 3) // 如果长度都还没达到能写入 "True" 字符串的最小所需空间,那就不干活了
{
// destination[0] = 'T';
// destination[1] = 'r';
// destination[2] = 'u';
// destination[3] = 'e';
BinaryPrimitives.WriteUInt64LittleEndian(MemoryMarshal.AsBytes(destination), 0x65007500720054); // "True"
charsWritten = 4;
return true;
}
}
}
先使用 MemoryMarshal.AsBytes 方法将要写入的 destination 当成 byte 二进制,接着使用 BinaryPrimitives.WriteUInt64LittleEndian 将 "True"
字符串对应的整数写入到二进制里面去,如此即可进行快速的完成写入字符串
同理,也对 "False"
字符串进行写入
BinaryPrimitives.WriteUInt64LittleEndian(MemoryMarshal.AsBytes(destination), 0x73006C00610046); // "Fals"
destination[4] = 'e';
charsWritten = 5;
如此写入的性能提升也是很多的,大佬的基准测试里面,对比 dotnet 6 的版本,耗时比例是之前的 0.66 倍
Method | Runtime | Mean | Ratio |
---|---|---|---|
FormatTrue | .NET 6.0 | 3.030 ns | 1.00 |
FormatTrue | .NET 7.0 | 1.997 ns | 0.66 |
在底层里面,对布尔这样的类型进行优化是非常有必要的,可以极大的提升整个上层应用的性能。因为如此底层的逻辑,在很多角落里,无论是否被程序员所关注到,都会被默默的很多次的被调用
既然在性能优化的角度上,通过使用整数替换逐个字符的方式,可以提升一些性能。既然学到了,那肯定要用上来呀,我在文件下载库的断点续传保存文件里面,就尝试使用此思想编写一点代码,代码请看 https://github.com/dotnet-campus/dotnetCampus.FileDownloader/blob/aa99be3a6c9efe5bc590111a5a4b95085061d622/src/dotnetCampus.FileDownloader/Utils/BreakpointResumptionTransmissions/BreakpointResumptionTransmissionRecordFileFormatter.cs#L128-L136
原本我是期望写入的是 DCFBPRTI
的 ASCII 编码的字符串的,现在更换为使用一个 long 代替,如下面代码
private static long GetHeader()
{
// 文件头是 dotnet campus File Downloader BreakPointResumptionTransmissionInfo 几个单词的首个字符 DCFBPRTI 缩写的 ASCII 值
// 刚好将这个 ASCII 的 byte 数组转换为一个 long 的值
//var headerByteList = System.Text.Encoding.ASCII.GetBytes("DCFBPRTI");
// var headerByteList = new byte[] { 68, 67, 70, 66, 80, 82, 84, 73 };
//return BitConverter.ToInt64(headerByteList)
return 5283938767475196740;
}
以上的代码只是因为我学到了这个方式进行优化,强行想试试而已,不代表着在业务代码里面一定要使用此方式哦
其实在编写代码的时候,以可读性为第一,除非遇到的模块是属于性能敏感的。但愿阅读本文不会带坏一些新手开发者,让新手开发者想着在任何的地方强行使用写整数代替可读性比较高的字符串处理方法
聊聊 dotnet 7 对 bool 与字符串互转的底层性能优化的更多相关文章
- DataTable 和Json 字符串互转
#region DataTable 转换为Json字符串实例方法 /// <summary> /// GetClassTypeJosn 的摘要说明 /// </summary> ...
- 用 opencv和numpy进行图片和字符串互转,并保存至 json
用 opencv和numpy进行图片和字符串互转,并保存至 json 转至 https://zhuanlan.zhihu.com/p/27349847 受 用 base64 进行图片和字符串互转,并保 ...
- python进制转化函数,10进制字符串互转,16进制字符串互转
来了老弟,emmmmm,今天想到平时经常用到编码转化,把字符串转化为16进制绕过等等的,今天想着用python写个玩,查询了一些资料,看了些bolg 上面的两个函数是将二进制流转化为16进制,data ...
- Delphi 集合和字符串互转
集合和字符串互转 集合: type TSocketState = (ssDisconnecting, ssDisconnected, ssConnected, ssConnecting, s ...
- LocalDateTime与字符串互转/Date互转/LocalDate互转/指定日期/时间比较
Java 8中表示日期和时间的类有多个,主要的有: Instant:表示时刻,不直接对应年月日信息,需要通过时区转换 LocalDateTime: 表示与时区无关的日期和时间信息,不直接对应时刻,需要 ...
- JavaScript json和字符串互转
JavaScript内置json和字符串互转的函数JSON,不需要引入外部组件 JSON.stringify(obj)将JSON转为字符串. JSON.parse(string)将字符串转为JSON格 ...
- json对象字符串互转
json对象字符串互转 1.Node.js中 JSON.parse(jsonstr); //可以将json字符串转换成json对象 JSON.stringify(jsonobj); //可以将json ...
- java 日期和字符串互转,依据当天整天时间 得到当天最后一秒的日期时间
java 日期和字符串互转.依据当天整天时间 得到当天最后一秒的日期时间 package com.hi; import java.text.DateFormat; import java.text ...
- 转 c#中 base64字符串与普通字符串互转
https://blog.csdn.net/hwt0101/article/details/79758912 转成 Base64 形式的 System.String: string a = &q ...
- python基础一整型、bool、字符串
1整型.bool.字符串 1.整型 --数字(int) 用于比较运算的 32位 -2 ** 31 ~ 2 ** 31 -1 64位 -2 ** 63 ~ 2 ** 63 -1 基础运算 ...
随机推荐
- FreeRTOS教程8 任务通知
1.准备材料 正点原子stm32f407探索者开发板V2.4 STM32CubeMX软件(Version 6.10.0) Keil µVision5 IDE(MDK-Arm) 野火DAP仿真器 XCO ...
- 安装npm install报错npm ERR! code ETIMEDOUT npm ERR! errno ETIMEDOUT npm ERR! network request to https://registry.npmjs.org/webpack-subresource-integrity failed, reason
执行命令:npm run dev 启动前端项目报如下错误,vue-cli-service是Vue一个启动的插件,需要安装 D:\nodejs\npm.cmd run dev > yuntan1h ...
- 记录--手把手教你Vue+ECharts+高德地图API实现天气预报数据可视化
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前言 所谓数据可视化,我们可以理解为从宏观角度来看一眼就能看出来整个数据的占比,走向.对于数据可视化,很多互联网公司是很看重这一块的,包括 ...
- C# URL参数编码
string s = "lw123abc测试信息!@#¥%--&*()--+"; Console.WriteLine("原数据:\t\t" + s); ...
- KingbaseES数据库分区表添加主键与索引的建议
一.初始化测试环境 # 数据库版本信息 KingbaseES V008R006C007B0012 on x86_64-pc-linux-gnu, compiled by gcc (GCC) 4.1.2 ...
- C#/.NET/.NET Core优秀项目和框架2024年3月简报
前言 公众号每月定期推广和分享的C#/.NET/.NET Core优秀项目和框架(每周至少会推荐两个优秀的项目和框架当然节假日除外),公众号推文中有项目和框架的介绍.功能特点.使用方式以及部分功能截图 ...
- #分层图最短路,Dijkstra#洛谷 4568 [JLOI2011]飞行路线
题目 一个无向图,每条边都有花费,可以有\(k\)次挑选边去除花费的机会,问从指定起点到指定终点的最小花费 分析 考虑用分层最短路完成,也就是在同一层走需要花费,不同层走不用花费,最终走到最底层,然后 ...
- #分治,决策单调性dp#CF868F Yet Another Minimization Problem
题目 给定一个序列 \(a\),要把它分成 \(k\) 个子段.(\(n\leq 10^5,k\leq 20\)) 每个子段的费用是其中相同元素的对数.求所有子段的费用之和的最小值. 分析 有一个很明 ...
- 玩转OpenHarmony PID:教你打造两轮平衡车
简介 此次为大家带来的是OpenAtom OpenHarmony(以下简称"OpenHarmony")系统与PID控制算法相结合并落地的平衡车项目. PID控制算法是一种经典的,并 ...
- Java 容器详解:使用与案例
Java容器是一套工具,用于存储数据和对象.可以与C++的STL类比.Java容器也称为Java Collection Framework (JCF).除了存储对象的容器之外,还提供了一套工具类,用于 ...