重新整理 .net core 实践篇 ———— linux上排查问题实用工具 [外篇]
前言
介绍下面几个工具:
Lldb
createdump
dotnet-dump
dotnet-gcdump
dotnet-symbol
Procdump
该文的前置篇为:
https://www.cnblogs.com/aoximin/p/16839812.html
献给初学者,这篇就只介绍下看下日志和lldb,毕竟东西太多了。
正文
我以官网的例子作为演示:https://buggyambfiles.blob.core.windows.net/bin/buggyamb_v1.1.zip
项目地址:https://github.com/ahmetmithat/buggyamb
我这里就已经发布可以访问了,并且用户nginx 作为转发,已经启动起来了。
步骤在前面两篇,如果看需要发布的,可以往前面两篇看看,这里就不多复述了。
[Unit]
Description=BuggyAmb
[Service]
WorkingDirectory=/var/buggyamb
ExecStart=/usr/bin/dotnet /var/buggyamb/BuggyAmb.dll
Restart=aways
RestartSec=10
SyslogIdentifier=BuggyAmb
User=root
Environment=ASPNETCORE_ENVIRONMENT=Development
Environment=DOTNET_PRINT_TELEMETRY_MESSAGE=false
Environment=ASPNETCORE_URLS=http://0.0.0.0:6000
[Install]
WantedBy=multi-user.target
service 的配置如上。
页面测试如下:
里面分别是:
慢、处理异常、不处理异常、崩溃、未找到页面、批处理
崩溃情况
这种比较好排查的,其实一般看日志就行。
我这里点一下Crash2,让程序崩溃。 这里说明一下,上面我用的是官方例子,直接可以看代码怎么崩溃的哈。
public class Crash2Model : PageModel
{
public string quote;
~Crash2Model()
{
if (quote.ToString() != string.Empty)
{
quote = null;
}
}
public void OnGet()
{
}
}
这个可以看下。
那么我们进行日志排查一下错误。
journalctl -r --identifier=BuggyAmb --since "10 minute ago"
告诉我们15行错误。
-r:按反向顺序打印日志,以便首先列出最新日志。
--identifier:请记住 SyslogIdentifier=buggyamb-identifier 测试应用程序的服务文件中的行。 (可以使用此方法强制日志仅显示适用于有问题的应用程序的条目。)
--since:显示在指定的上一时期记录的信息。 示例: --since "10 minute ago" 或 --since "2 hour ago".
journalctl 还有很多其他的功能,这里就不一一举例了。
核心转储
centos 默认不开启的:
可以看下这个怎么开启的:
https://blog.csdn.net/ProgramVAE/article/details/105921381
#!/bin/bash
#me: coredumpshell.sh
### Description: enable coredump and format the name of core file on centos system
# enable coredump whith unlimited file-size for all users
echo -e "\n# enable coredump whith unlimited file-size for all users\n* soft core unlimited" >> /etc/security/limits.conf
# set the path of core file with permission 777
cd /var/buggyamb && mkdir corefile && chmod 777 corefile
# format the name of core file.
# %% – 符号%
# %p – 进程号
# %u – 进程用户id
# %g – 进程用户组id
# %s – 生成core文件时收到的信号
# %t – 生成core文件的时间戳(seconds since 0:00h, 1 Jan 1970)
# %h – 主机名
# %e – 程序文件名
echo -e "/var/buggyamb/corefile/core-%e-%s-%u-%g-%p-%t" > /proc/sys/kernel/core_pattern
# for centos7 system(update 2017.2.3 21:44)
echo -e "/var/buggyamb/corefile/core-%e-%s-%u-%g-%p-%t" > /etc/sysctl.conf
# suffix of the core file name
echo -e "1" > /proc/sys/kernel/core_uses_pid
运行之后就开启了。
centos 一般用不上,我也没有去调试过,这里就不演示了,只能说有这种东西。
使用lldb
安装:yum install lldb
前文提及到这个要安装lldb 3.9 以上的。
按照这个文档来编译安装也行:
https://github.com/dotnet/diagnostics/blob/main/documentation/lldb/linux-instructions.md
在 lldb 中打开核心转储文件之前,请按照以下必需步骤设置符号路径,下载符号,并在打开 lldb 时自动加载 SOS :
安装 dotnet 符号工具:
dotnet tool install -g dotnet-symbol
下载目标转储文件的符号:
dotnet-symbol <path_of_dump_file>
安装 SOS:
安装 dotnet-sos 全局工具:
dotnet tool install -g dotnet-sos
安装 SOS:
dotnet-sos install
最后成功的样子:
使用createdump:
Createdump 会与每个 .NET Core 运行时一起自动安装。
如 创建的ump 配置策略 文档中所述,可以设置具有环境变量的配置选项。 这些将作为参数传递给创建的ump 命令。 下面是支持的环境变量:
COMPlus_DbgEnableMiniDump:如果设置为 1,则在终止时启用自动核心转储生成。 默认值为 0 。
COMPlus_DbgMiniDumpType:这是将要创建的微型转储文件的类型。 此值的默认值为 2 (或枚举类型 MiniDumpWithPrivateReadWriteMemory) 。 这意味着生成的转储文件将包括 GC 堆以及捕获进程中所有现有线程的堆栈跟踪所需的信息。
COMPlus_DbgMiniDumpName:如果设置,请用作模板来创建转储文件路径和文件名。 可以使用参数将 PID 放入名称中 %d 。 默认模板为 /tmp/coredump.%d. 通过使用此环境变量,可以配置输出目录。
COMPlus_CreateDumpDiagnostics:如果设置为 1,则启用创建的ump 工具诊断消息 (TRACE 宏) 。 如果 createdump 不能按预期工作并且不生成内存转储文件,则此设置可能很有用。
进行开启:
然后重启,再来点击clash3进行崩溃一下。
可以看到这里就有了。
这里我们先转储文件符号一下:
dotnet-symbol /tmp/coredump.9784-o /dumps/symbols/ --host-only
然后进去一下:
lldb --core /tmp/coredump.9784
这个时候要加载一下dotnet 符号。
setsymbolserver -directory /dumps/symbols/
然后加载转储文件符号:
loadsymbols
这样就搞定了。
clrsthread 查看一下线程的情况:
这里可以看到里面有个异常是15号线程。
切到15号线程:
setthread 15:
然后查看一下clrstack(调用栈信息):
这个似乎没有告诉我们很多很有用的信息,只能告诉我们线程异常了,当然也告诉我们具体的行,可以去看下去源代码看下什么类型异常,但是有跟好用的pe。
用pe查看下:
pe -- Displays and formats fields of any object derived from the Exception class at the specified address.
这样就定位到具体的崩溃文件了。
知道了崩溃是因为HttpWebRequest,希望的是能查到到底是哪个访问url造成了崩溃。
下面这个图,证明可调用了HttpWebRequest引发的:
使用dumpheap:dumpheap -stat -type System.Net.HttpWebRequest 查看httpwebrequest 调用栈:
查看栈地址:
然后是根据地址查看对象:dumpobj 00007fe0c4442f28
这个webrequest 里面有一个是system.url 我们写程序的知道这是访问地址。
然后继续查这个对象,上面那个value 就是地址哈。
00007fe0c4437cf8
然后可以看到url 地址:
第一个就是了,为什么确认第一个就是,看名字。
这样就查到了。
先到这里吧,介绍这个lldb 是为了查看非托管栈的,如果查看托管的一般使用dotnet-dump 就好了。
而且一般是用来分析cpu 和 内存高的地方,一般服务端错误会有日志的。
结
继续后面演示cpu 和 内存高的例子,这个对服务端更有实用性。
重新整理 .net core 实践篇 ———— linux上排查问题实用工具 [外篇]的更多相关文章
- 重新整理 .net core 实践篇 ———— linux上排查问题 [外篇]
前言 简单介绍一下在排查问题.献给初学者. 该文的前置篇: https://www.cnblogs.com/aoximin/p/16838657.html 正文 什么是linux系统 linux 是基 ...
- 重新整理 .net core 实践篇 ———— linux上性能排查 [外篇]
前言 该文的前置篇为: https://www.cnblogs.com/aoximin/p/16839830.html 本文介绍性能排查. 正文 上一节是出现错误了,如何去排查具体问题. 这一节介绍一 ...
- 重新整理 .net core 实践篇 ———— linux 上线篇 [外篇]
前言 简单整理一个linux 简单上线. 这个是该系列的外篇,该系列继续更新.献给刚学的人. 正文 安装实例 dotnet new webapp -n AspNetCoreDemo -o firstw ...
- 重新整理 .net core 实践篇————配置应用[一]
前言 本来想整理到<<重新整理.net core 计1400篇>>里面去,但是后来一想,整理 .net core 实践篇 是偏于实践,故而分开. 因为是重新整理,那么就从配置开 ...
- xsos:一个在Linux上阅读SOSReport的工具
xsos:一个在Linux上阅读SOSReport的工具 时间 2019-05-23 14:36:29 51CTO 原文 http://os.51cto.com/art/201905/596889 ...
- Linux 上的数据可视化工具
Linux 上的数据可视化工具 5 种开放源码图形化工具简介 Linux® 上用来实现数据的图形可视化的应用程序有很多,从简单的 2-D 绘图到 3-D 制图,再到科学图形编程和图形模拟.幸运的是,这 ...
- 在Linux上安装Elasticsearch Head工具.md
在Linux上安装Elasticsearch Head工具 1.修改elasticsearch的参数 编辑elasticsearch的配置文件elasticsearch.yml $ vim /data ...
- 重新整理 .net core 实践篇————依赖注入应用[二]
前言 这里介绍一下.net core的依赖注入框架,其中其代码原理在我的另一个整理<<重新整理 1400篇>>中已经写了,故而专门整理应用这一块. 以下只是个人整理,如有问题, ...
- 重新整理 .net core 实践篇—————grpc[三十三]
前言 简单整理一下grpc. 正文 什么是grpc? 一个远程过程调用框架,可以像类一样调用远程方法. 这种模式一般来说就是代理模式,然后都是框架自我生成的. 由google 公司发起并开源,故而前面 ...
随机推荐
- screen -中断保留-屏幕同步
工作中经常用到 screen 用处: 中断保留 和屏幕同步. yum install screen screen -S name 创建 -ls 查看 -r 恢复 -x 同屏
- 《吐血整理》进阶系列教程-拿捏Fiddler抓包教程(19)-Fiddler精选插件扩展安装,将你的Fiddler武装到牙齿
1.简介 Fiddler本身的功能其实也已经很强大了,但是Fiddler官方还有很多其他扩展插件功能,可以更好地辅助Fiddler去帮助用户去开发.测试和管理项目上的任务.Fiddler已有的功能已经 ...
- Gitea v1.17.0 正式发布 | 集成软件包管理器、容器镜像仓库
我们自豪地宣布 Gitea v1.17.0 发布了.本次发布带来了诸多新特性和累积的更新,我们强烈建议用户在更新到最新版本之前仔细阅读发行注记. 在 1.17.0 版本的开发中我们一共合并了 645 ...
- 注解@DependsOn解析
作用 @DependsOn注解可以定义在类和方法上,意思是我这个组件要依赖于另一个组件,也就是说被依赖的组件会比该组件先注册到IOC容器中. 在哪里被解析 解析的地方在 ComponentScanAn ...
- TDengine概述以及架构模型
TDengine TDengine是一个高效的存储.查询.分析时序大数据的平台,专为物联网.车联网.工业互联网.运维监测等优化而设计. 您可以像使用关系型数据库MySQL一样来使用它. TDengin ...
- 使用 Elastic 技术栈构建 K8S 全栈监控 -1:搭建 ElasticSearch 集群环境
文章转载自:https://www.qikqiak.com/post/k8s-monitor-use-elastic-stack-1/ 操作步骤 kubectl create ns elastic k ...
- ssh访问控制,阻断异常IP,防止暴力破解
文章转载自:https://mp.weixin.qq.com/s/oktVy09zJAAH_MMKdXjtIA 由于业务需要将Linux服务器映射到公网访问,SSH 端口已经修改,但还是发现有很多IP ...
- Docker搭建kafka及监控
环境安装 docker安装 yum update yum install docker # 启动 systemctl start docker # 加入开机启动 systemctl enable do ...
- Linux+Wine玩火影忍者究极风暴3指南
如果你的系统没有Wine先装Wine,Wine在各大发行版的源都能找到.记住32位和64位的Wine都要装 去https://www.playonlinux.com/wine/binaries/pho ...
- Springboot 之 HandlerMethodReturnValueHandler 运用
简介 现在项目中大部分采用前后端分离的架构,采用这种架构的项目,在返回数据时,几乎都是采用返回 json 格式的数据.而 spring 中返回 json 格式的数据一般采用 @RestControll ...