.NET Core技术研究-通过Roslyn代码分析技术规范提升代码质量
随着团队越来越多,越来越大,需求更迭越来越快,每天提交的代码变更由原先的2位数,暴涨到3位数,每天几百次代码Check In,补丁提交,大量的代码审查消耗了大量的资源投入。
如何确保提交代码的质量和提测产品的质量,这两个是非常大的挑战。
工欲善其事,必先利其器。在上述需求背景下,今年我们准备用工具和技术,全面把控并提升代码质量和产品提测质量。即:
1. 代码质量提升:通过自定义代码扫描规则,将有问题的代码、不符合编码规则的代码扫描出来,禁止签入
2. 产品提测质量:通过单元测试覆盖率和执行通过率,严控产品提交质量,覆盖率和通过率达不到标准,无法提交测试。
准备用2篇文章,和大家分享我们是如何提升代码质量和产品提测质量的。今天分享第一篇:通过Roslyn代码分析全面提升代码质量。
一、什么是Roslyn
Roslyn 是微软开源的 .NET 编译平台(.NET Compiler Platform)。 编译平台支持 C# 和 Visual Basic 代码编译,并提供丰富的代码分析 API。
利用Roslyn可以生成代码分析器和代码修补程序,从而发现和更正编码错误。
分析器不仅理解代码的语法和结构,还能检测应更正的做法。 代码修补程序建议一处或多处修复,以修复分析器发现的编码错误。
我们写下面一堆代码,Roslyn编译器会有如下提示:
通过编写分析器和代码修补程序,主要服务以下场景:
- 强制执行团队编码标准(Local)
- 提供库包方面的指导约束(Nuget)
- 提供代码分析器相关的VSIX扩展插件(Visual Studio Marketplace)
Roslyn是如何做到代码分析的呢?这背后依赖于一套强大的语法分析和API:
上图中:Language Service:语言层面的服务,可以简单理解为我们在VS中编码时,可以实现的语法高亮、查找所有引用、重命名、转到定义、格式化、抽取方法等操作
Compiler API:编译器API,这里提供了Syntax Tree API代码语法树API,Symbol API代码符号API
Binding and Flow Anllysis APIs绑定和流分析API(https://joshvarty.com/2015/02/05/learn-roslyn-now-part-8-data-flow-analysis/),
Emit API编译反射发出API(https://joshvarty.com/2016/01/16/learn-roslyn-now-part-16-the-emit-api/)
这里我们详细看一下语法树、符号、语义模型、工作区:
1. 语法树是一种由编译器 API 公开的基础数据结构。 这些树表示源代码的词法和语法结构。其包含:
- 语法节点:是语法树的一个主要元素。 这些节点表示声明、语句、子句和表达式等语法构造。
- 语法标记:表示代码的最小语法片段。 语法标记包含关键字、标识符、文本和标点。
- 琐碎内容:对正常理解代码基本上没有意义的源文本部分,例如空格、注释和预处理器指令。
- 范围:每个节点、标记或琐碎内容在源文本内的位置和包含的字符数。
- 种类:标识节点、标记或琐碎内容所表示的确切语法元素。
- 错误:表示源文本中包含的语法错误。
看一张语法树的图:
2. 符号:符号表示源代码声明的不同元素,或作为元数据从程序集中导出。每个命名空间、类型、方法、属性、字段、事件、参数或局部变量都由符号表示。
3. 语义模型:语义模型表示单个源文件的所有语义信息。 可使用语义模型查找到以下内容:
- 在源中特定位置引用的符号。
- 任何表达式的结果类型。
- 所有诊断(错误和警告)。
- 变量流入和流出源区域的方式。
- 更多推理问题的答案。
4. 工作区:工作区是对整个解决方案执行代码分析和重构的起点。相关的API可以实现:
将解决方案中项目的全部相关信息组织为单个对象模型,可让用户直接访问编译器层对象模型(如源文本、语法树、语义模型和编译),而无需分析文件、配置选项,或管理项目内依赖项。
了解了Roslyn的大致情况之后,我们开始基于Roslyn做一些“不符合编程规范要求(团队自定义的)”的代码分析。
二、基于Roslyn进行代码分析
接下来讲通过Show case的方法,通过实际的场景和大家分享。在我们编写实际的代码分析器之前,我们先把开发环境准备好 :
使用VS2017创建一个Analyzer with Code Fix工程
因为我本机的VS2019找了好久没找到对应的工程,这个章节,使用VS2017吧
创建完成会有两个工程:
其中,TeldCodeAnalyzer.Vsix工程,主要用以生成VSIX扩展文件
TeldCodeAnalyzer工程,主要用于编写代码分析器。
工程转换好之后,我们开始编码吧。
1. catch 吞掉异常场景
问题:catch吞掉异常后,线上很难排查问题,同时确定哪块代码有问题
示例代码:
- try
- {
- var logService = HSFService.Proxy<ILogService>();
- logService.SendMsg(new SysActionLog());
- }
- catch (Exception ex)
- {
- }
需求:当开发人员在catch吞掉异常时,给与编程提示:异常吞掉时必须上报监控或者日志
明确了上述需要,我们开始编写Roslyn代码分析器。ExceptionCatchWithMonitorAnalyzer
我们详细解读一下:
① ExceptionCatchWithMonitorAnalyzer必须继承抽象类DiagnosticAnalyzer
② 重写方法SupportedDiagnostics,注册代码扫描规则:DiagnosticDescriptor
- internal static DiagnosticDescriptor Rule = new DiagnosticDescriptor(DiagnosticId, Title, MessageFormat, Category,
- DiagnosticSeverity.Warning, isEnabledByDefault: true, description: Description);
- public override ImmutableArray<DiagnosticDescriptor> SupportedDiagnostics => ImmutableArray.Create(Rule);
③ 重写方法Initialize,注册Microsoft.CodeAnalysis.SyntaxNode完成Catch语句的语义分析后的事件Action
- public override void Initialize(AnalysisContext context)
- { context.ConfigureGeneratedCodeAnalysis(GeneratedCodeAnalysisFlags.Analyze | GeneratedCodeAnalysisFlags.None);
- context.EnableConcurrentExecution();
- context.RegisterSyntaxNodeAction(AnalyzeDeclaration, SyntaxKind.CatchClause);
- }
④ 实现语法分析AnalyzeDeclaration,检查对catch语句中代码实现
- private void AnalyzeDeclaration(SyntaxNodeAnalysisContext context)
- {
- var catchClause = (CatchClauseSyntax)context.Node;
- var block = catchClause.Block;
- foreach (var statement in block.Statements)
- {
- if (statement is ThrowStatementSyntax)
- {
- return;
- }
- }
- if (Common.IsReallyContains(block, "MonitorClient") == false)
- {
- context.ReportDiagnostic(Diagnostic.Create(Rule, block.GetLocation()));
- }
- }
补充一下Common.IsReallyContains方法:
- class Common
- {
- public static bool IsReallyContains(SyntaxNode node, string statement)
- {
- return node.ToString().Contains(statement) && node.DescendantNodes().OfType<LiteralExpressionSyntax>().Count(p => p.ToString().Contains(statement)) ==0 ;
- }
- }
代码实现后的效果(直接调试VSIX工程即可)
代码编译后也有对应Warnning提示
2. 在For循环中进行服务调用
问题:for循环中调用RPC服务,每次访问都会发起一次RPC请求,如果循环次数太多,性能很差,建议使用批量处理的RPC方法
示例代码:
- foreach (var item in items)
- {
- var logService = HSFService.Proxy<ILogService>();
- logService.SendMsg(new SysActionLog());
- }
需求:当开发人员在For循环中调用HSF服务时,给与编程提示:不建议在循环中调用HSF服务, 建议调用批量处理方法.
明确了上述需要,我们开始编写Roslyn代码分析器。HSFForLoopAnalyzer
- [DiagnosticAnalyzer(LanguageNames.CSharp)]
- public sealed class HSFForLoopAnalyzer : DiagnosticAnalyzer
- {
- public const string DiagnosticId = "TA001";
- internal const string Title = "增加循环中HSF服务调用检查";
- public const string MessageFormat = "不建议在循环中调用HSF服务, 建议调用批量处理方法.";
- internal const string Category = "CodeSmell";
- internal static DiagnosticDescriptor Rule = new DiagnosticDescriptor(DiagnosticId, Title, MessageFormat, Category,
- DiagnosticSeverity.Warning, isEnabledByDefault: true);
- public override ImmutableArray<DiagnosticDescriptor> SupportedDiagnostics => ImmutableArray.Create(Rule);
- public override void Initialize(AnalysisContext context)
- {
- context.RegisterSyntaxNodeAction(AnalyzeMethodForLoop, SyntaxKind.InvocationExpression);
- }
- private static void AnalyzeMethodForLoop(SyntaxNodeAnalysisContext context)
- {
- var expression = (InvocationExpressionSyntax)context.Node;
- string exressionText = expression.ToString();
- if (Common.IsReallyContains(expression, "HSFService.Proxy<"))
- {
- var loop = expression.Ancestors().FirstOrDefault(p => p is ForStatementSyntax || p is ForEachStatementSyntax || p is DoStatementSyntax || p is WhileStatementSyntax);
- if (loop != null)
- {
- var diagnostic = Diagnostic.Create(Rule, expression.GetLocation());
- context.ReportDiagnostic(diagnostic);
- return;
- }
- if (Common.IsReallyContains(expression, ">.") == false)
- {
- var syntax = expression.Ancestors().FirstOrDefault(p => p is LocalDeclarationStatementSyntax);
- if (syntax != null)
- {
- var declaration = (LocalDeclarationStatementSyntax)syntax;
- var variable = declaration.Declaration.Variables.SingleOrDefault();
- var method = declaration.Ancestors().First(p => p is MethodDeclarationSyntax);
- var expresses = method.DescendantNodes().Where(p => p is InvocationExpressionSyntax);
- foreach (var express in expresses)
- {
- loop = express.Ancestors().FirstOrDefault(p => p is ForStatementSyntax || p is ForEachStatementSyntax || p is DoStatementSyntax || p is WhileStatementSyntax);
- if (loop != null)
- {
- var diagnostic = Diagnostic.Create(Rule, expression.GetLocation());
- context.ReportDiagnostic(diagnostic);
- return;
- }
- }
- }
- }
- }
- }
- }
基本的实现方式,和上一个差不多,唯一不同的逻辑是在实际的代码分析过程中,AnalyzeMethodForLoop。大家可以根据自己的需要写一下。
实际的效果:
还有几个代码检查场景,基本都是同样的实现思路,再次不一一罗列了。
在这里还可以自动完成代理修补程序,这个地方我们还在研究中,可能每个业务代码的场景不同,很难给出一个通用的改进代码,所以这个地方等后续我们完成后,再和大家分享。
三、通过Roslyn实现静态代码扫描
线上很多代码已经写完了,发布上线了,对已有的代码进行代码扫描也是非常重要的。因此,我们对catch吞掉异常的代码进行了一次集中扫描和改进。
那么基于Roslyn如何实现静态代码扫描呢?主要的步骤有:
① 创建一个编译工作区MSBuildWorkspace.Create()
② 打开解决方案文件OpenSolutionAsync(slnPath);
③ 遍历Project中的Document
④ 拿到代码语法树、找到Catch语句CatchClauseSyntax
⑤ 判断是否有throw语句,如果没有,收集数据进行通知改进
看一下具体代码实现:
先看一下Nuget引用:
Microsoft.CodeAnalysis
Microsoft.CodeAnalysis.Workspaces.MSBuild
代码的具体实现:
- public async Task<List<CodeCheckResult>> CheckSln(string slnPath)
- {
- var slnFile = new FileInfo(slnPath);
- var results = new List<CodeCheckResult>();
- var solution = await MSBuildWorkspace.Create().OpenSolutionAsync(slnPath);
- if (solution.Projects != null && solution.Projects.Count() > 0)
- {
- foreach (var project in solution.Projects.ToList())
- {
- var documents = project.Documents.Where(x => x.Name.Contains(".cs"));
- foreach (var document in documents)
- {
- var tree = await document.GetSyntaxTreeAsync();
- var root = tree.GetCompilationUnitRoot();
- if (root.Members == null || root.Members.Count == 0) continue;
- //member
- var firstmember = root.Members[0];
- //命名空间Namespace
- var namespaceDeclaration = (NamespaceDeclarationSyntax)firstmember;
- foreach (var classDeclare in namespaceDeclaration.Members)
- {
- var programDeclaration = classDeclare as ClassDeclarationSyntax;
- foreach (var method in programDeclaration.Members)
- {
- //方法 Method
- var methodDeclaration = (MethodDeclarationSyntax)method;
- var catchNode = methodDeclaration.DescendantNodes().FirstOrDefault(i => i is CatchClauseSyntax);
- if (catchNode != null)
- {
- var catchClause = catchNode as CatchClauseSyntax;
- if (catchClause != null || catchClause.Declaration != null)
- {
- if (catchClause.DescendantNodes().OfType<ThrowStatementSyntax>().Count() == 0)
- {
- results.Add(new CodeCheckResult()
- {
- Sln = slnFile.Name,
- ProjectName = project.Name,
- ClassName = programDeclaration.Identifier.Text,
- MethodName = methodDeclaration.Identifier.Text,
- });
- }
- }
- }
- }
- }
- }
- }
- }
- return results;
- }
以上是通过Roslyn代码分析全面提升代码质量的一些具体实践,分享给大家。
周国庆
2020/5/2
.NET Core技术研究-通过Roslyn代码分析技术规范提升代码质量的更多相关文章
- .NET Core技术研究系列-索引篇
随着.NET Core相关技术研究的深入,现在将这一系列的文章,整理到一个索引页中,方便大家翻阅查找,同时,后续也会不断补充进来. .NET Core技术研究-WebApi迁移ASP.NET Core ...
- .NET Core技术研究-主机
前一段时间,和大家分享了 ASP.NET Core技术研究-探秘Host主机启动过程 但是没有深入说明主机的设计.今天整理了一下主机的一些知识,结合先前的博文,完整地介绍一下.NET Core的主机的 ...
- ASP.NET Core技术研究-全面认识Web服务器Kestrel
因为IIS不支持跨平台的原因,我们在升级到ASP.NET Core后,会接触到一个新的Web服务器Kestrel.相信大家刚接触这个Kestrel时,会有各种各样的疑问. 今天我们全面认识一下ASP. ...
- ASP.NET Core技术研究-探秘Host主机启动过程
当我们将原有ASP.NET 应用程序升级迁移到ASP.NET Core之后,我们发现代码工程中多了两个类Program类和Startup类. 接下来我们详细探秘一下通用主机Host的启动过程. 一.P ...
- .Net Core技术研究-Span<T>和ValueTuple<T>
性能是.Net Core一个非常关键的特性,今天我们重点研究一下ValueTuple<T>和Span<T>. 一.方法的多个返回值的实现,看ValueTuple<T> ...
- .NET Core技术研究-配置读取
升级ASP.NET Core后,配置的读取是第一个要明确的技术.原先的App.Config.Web.Config.自定义Config在ASP.NET Core中如何正常使用.有必要好好总结整理一下,相 ...
- .NET Core技术研究-中间件的由来和使用
我们将原有ASP.NET应用升级到ASP.NET Core的过程中,会遇到一个新的概念:中间件. 中间件是ASP.NET Core全新引入的概念.中间件是一种装配到应用管道中以处理请求和响应的软件. ...
- ASP.NET Core技术研究-探秘依赖注入框架
ASP.NET Core在底层内置了一个依赖注入框架,通过依赖注入的方式注册服务.提供服务.依赖注入不仅服务于ASP.NET Core自身,同时也是应用程序的服务提供者. 毫不夸张的说,ASP.NET ...
- .Net Core技术研究-WebApi迁移ASP.NET Core2.0
随着ASP.NET Core 2.0发布之后,原先运行在Windows IIS中的ASP.NET WebApi站点,就可以跨平台运行在Linux中.我们有必要先说一下ASP.NET Core. ASP ...
随机推荐
- TP5快速入门
一.查询 //order支持使用数组对多个字段的排序,例如order(['order','id'=>'desc']) //group方法只有一个参数,并且只能使用字符串. //having方法只 ...
- 微信小程序页面通信
目录 微信小程序页面通信 方式一:通过URL 方式二:通过全局变量 方式三:通过本地存储 方式四:通过路由栈 微信小程序页面通信 方式一:通过URL // A 页面 wx.navigateTo({ u ...
- CVE-2020-1938:Apache-Tomcat-Ajp漏洞-复现
0x00 漏洞简介 Apache与Tomcat都是Apache开源组织开发的用于处理HTTP服务的项目,两者都是免费的,都可以做为独立的Web服务器运行. Apache Tomcat服务器存在文件包含 ...
- 前端学习笔记 --ES6新特性
前言 这篇博客是我在b站进行学习es6课程时的笔记总结与补充. 此处贴出up主的教程视频地址:深入解读ES6系列(全18讲) 1.ES6学习之路 1.1 ES6新特性 1. 变量 2. 函数 3. 数 ...
- GeoGebra重复手段实现
1.自定义工具部分可以在网上搜一些别人做的工具,主要是把自己经常做的一些任务做成工具,减少重复过程 2.列表部分的简单操作如图所示,实现对三个点的多项式拟合 3.通过序列指令格式可以做一个好玩的效果, ...
- 用python代替人脑运算24点游戏
前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:老方玩编程 PS:如有需要Python学习资料的小伙伴可以加点击下方链 ...
- PHP 常用数组的具体运用?常用吗?
在 PHP 中,有三种类型的数组: 数值数组 - 带有数字 ID 键的数组 关联数组 - 带有指定的键的数组,每个键关联一个值 多维数组 - 包含一个或多个数组的数组 看具体实例: 创建数组 < ...
- SQLServer系统表使用简介(sysobjects、syscolumns、syscomments等)转载
sysobjects:记录了数据库中每一个表.视图.约束.存储过程等详细内容的表. 表中常用的字段如下 : 列名 数据类型 描述 name sysname 对象名 id int 对象标识号 xtype ...
- 页面性能分析-Chrome Dev Tools
一.分析面板介绍 进行页面性能快速分析的主要是图中圈出来的几个模块功能: Network : 页面中各种资源请求的情况,这里能看到资源的名称.状态.使用的协议(http1/http2/quic...) ...
- tensorflow1.0 构建神经网络做图片分类
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist = input_dat ...