UCS使用双列直插式内存模块(Dual In-line Memory Module (DIMM) )作为RAM模块。

根据文档介绍,主要有如下部分:
1、Memory placement 《内存放置》
2、Troubleshoot DIMM’s via UCSM and CLI 《通过UCSM和CLI来排查DIMM》
3、Logs to check in tech support 《登录检查tech-support>

来自 <https://www.cisco.com/c/en/us/support/docs/servers-unified-computing/ucs-b-series-blade-servers/200775-Troubleshoot-DIMM-memory-issues-in-UCS.html>

一些术语和关键词:

Memory Placement

内存放置可能是UCS中最值得注意的物理方面之一。通常,UCS附带了预先填充了请求数量的内存。
安装方面,可以参考安装指南:
https://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/hw/blade-servers/install/B200.html#wp1035141

有关内存填充规则,请参阅B系列特定平台的技术规范,如下是B系列技术规格的链接:
http://www.cisco.com/c/en/us/products/servers-unified-computing/ucs-b-series-blade-servers/datasheet-listing.html

Memory Error

Correctable vs. Uncorrectable Errors》》》可纠正与不可纠正的错误

Whether a particular error is correctable or uncorrectable depends on the strength of the ECC code employed within the memory system. Dedicated hardware is able to fix correctable errors when they occur with no impact on program execution.

The DIMMs with correctable error are not disabled and are available for the OS to use. The Total Memory and Effective Memory be the same (taking memory mirroring into account). These correctable errors reported in UCSM operability state as Degraded while overall operability Operable with correctable errors.

Uncorrectable errors generally cannot be fixed, and may make it impossible for the application or operating system to continue execution. The DIMMs with uncorrectable error is disabled and OS does not see that memory. UCSM operState change to ""Inoperable"" in this case.

特定错误是可纠正还是不可纠正取决于存储器系统内采用的ECC代码的强度。 专用硬件能够在发生错误时修复可纠正的错误,而不会影响程序执行。
具有可纠正错误的DIMM未禁用,可供操作系统使用。 总内存和有效内存相同(考虑内存镜像)。 在UCSM可操作性状态中报告的这些可纠正错误为Degraded,而总体可操作性可操作且具有可纠正的错误。
通常不能修复无法纠正的错误,并且可能使应用程序或操作系统无法继续执行。 具有无法纠正错误的DIMM被禁用,操作系统看不到该内存。 在这种情况下,UCSM operState更改为“Inoperable ”。

通过UCSM和CLI来排查DIMM

通过GUI检查Errors:

为了获取统计视图:
Equipment > Chassis > Server > Inventory > Memory 然后针对对应的memory右击,选择 show navigator.

通过CLI来检查errors:

scope server x/y -> show memory detail
scope server x/y -> show memory-array detail
scope server x/y -> scope memory-array x -> show stats history memory-array-env-stats detail

Eg:
UCS-A# scope server 1/3
UCS-A /chassis/server # show memory detail
UCS-A /chassis/server # show memory-array detail
UCS-A /chassis/server # scope memory-array x 
UCS-A /chassis/server #show stats history memory-array-env-stats detail

还可以访问DIMM:
UCS-A# scope server 1/3
UCS-A /chassis/server # scope memory-array x 
UCS-A /chassis/server/memory-array #scope DIMM x

然后,您可以从中获取每DIMM统计信息或重置错误计数。
bdsol-6248-06-B /chassis/server/memory-array/dimm # reset-errors
bdsol-6248-06-B /chassis/server/memory-array/dimm* # commit-buffer
bdsol-6248-06-B /chassis/server/memory-array/dimm # show stats memory-error-state

UCS内存问题排查的更多相关文章

  1. Chrome JS内存泄漏排查方法(Chrome Profiles)

     原文网址:http://blog.csdn.net/kaitiren/article/details/19974269 JS内存泄漏排查方法(Chrome Profiles)   Google Ch ...

  2. windows 下面的内存泄漏排查.

    内存泄漏排查 一下本人只是简单的介绍一个实用, 如果读者很感兴趣, 可以查阅msdn自己去深入调查相关的API和原理. API 介绍 1. 马上打印泄漏信息:_CrtDumpMemoryLeaks() ...

  3. 内存快照排查OOM,加密时错误方法指定provider方式错误引起的OOM

    写在前面: 最近开始总结内存方面的东西,已经总结以前遇到的一些内存案例分享下,接下来还有几篇,然后是进程/线程相关的,逐渐形成我的知识体系树 如果你有兴趣,可以文章末尾的公众号二维码一起梳理这些信息. ...

  4. Spring Boot引起的“堆外内存泄漏”排查及经验总结

    小结: 检索词:C++内存分配器.jvm内存模型.gdb.内存泄露 https://tech.meituan.com/2019/01/03/spring-boot-native-memory-leak ...

  5. Netty堆外内存泄露排查与总结

    导读 Netty 是一个异步事件驱动的网络通信层框架,用于快速开发高可用高性能的服务端网络框架与客户端程序,它极大地简化了 TCP 和 UDP 套接字服务器等网络编程. Netty 底层基于 JDK ...

  6. 【转载】Spring Boot引起的“堆外内存泄漏”排查及经验总结

    背景 为了更好地实现对项目的管理,我们将组内一个项目迁移到MDP框架(基于Spring Boot),随后我们就发现系统会频繁报出Swap区域使用量过高的异常.笔者被叫去帮忙查看原因,发现配置了4G堆内 ...

  7. java程序——CPU过高100%及内存泄露排查

    CPU过高 这类问题可以使用 top 命令观察一些,CPU 是不是都被 Java 程序占用了.比如下面这个截图: 服务器的 CPU 大多都被 Java 占用了.这正是我们之前生产上 CPU 过高的一个 ...

  8. Netty堆外内存泄漏排查,这一篇全讲清楚了

    上篇文章介绍了Netty内存模型原理,由于Netty在使用不当会导致堆外内存泄漏,网上关于这方面的资料比较少,所以写下这篇文章,专门介绍排查Netty堆外内存相关的知识点,诊断工具,以及排查思路提供参 ...

  9. Spring Boot引起的“堆外内存泄漏”排查及经验总结 strace

    小结: 检索词:C++内存分配器.jvm内存模型.gdb.内存泄露 https://tech.meituan.com/2019/01/03/spring-boot-native-memory-leak ...

随机推荐

  1. UVA 1267 Network(DFS)

    题目链接:https://vjudge.net/problem/UVA-1267 首先我们要把这样一棵无根树转换成有根树,那么树根我们可以直接使用$VOD$. 还有一个性质:如果深度为$d$的一个节点 ...

  2. P2141珠心算测验题解

    先来看一下题目:某学校的珠心算老师采用一种快速考察珠心算加法能力的测验方法.他随机生成一个正整数集合,集合中的数各不相同,然后要求学生回答:其中有多少个数,恰好等于集合中另外两个(不同的)数之和? 这 ...

  3. 445. 两数相加 II

    Q: A: 这种题的用例是一定会搞一些很大的数的.long都会溢出,所以我们就不用尝试转数字做加法转链表的方法了.另外直接倒置两个链表再做加法的做法会改变原链表,题干也说了禁止改动原链表. 1.求两个 ...

  4. UltraEdit设置打开的文件类型,怎么打开大文本文件

    点击高级,配置,选择文件处理下的临时文件,设置如图即可打开超大文本文件. 补充:视图——显示行号.

  5. Codeforces Round #599 (Div. 2) B2. Character Swap (Hard Version)

    This problem is different from the easy version. In this version Ujan makes at most 2n2n swaps. In a ...

  6. java到js的中文无法显示,中文显示位(?)

    今天遇到这么一个问题,用js调用java的get请求,得到的json数据中中文无法正常显示,jsp文件中都是申明utf-8格式的,查询了一番,发现问题出现在@ResponseBody上 @Respon ...

  7. 508,css优先级算法如何计算?

    优先级就近原则,同权情况下样式定义最近者为准 载入样式以最后载入的定位为准 优先级:!important>id > class >tag;  !important比内联优先级高 (百 ...

  8. opencv python:直线检测 与 圆检测

    霍夫直线变换介绍 霍夫圆检测 现实中: example import cv2 as cv import numpy as np # 关于霍夫变换的相关知识可以看看这个博客:https://blog.c ...

  9. 试题编号: 201903-3 试题名称: 损坏的RAID5

    这题的数据未免也太水了,题目的意思好像默认是每块磁盘装载数据的长度是相等的.我写了判断每次取数据是否会超过每块磁盘存的数据的长度,然而并没有什么卵用.交上去20分,写了个数据测了下,如果要求的块太大的 ...

  10. 关于anaconda-navigator打不开的问题

    19-10版本的anaconda-navigator打不开,没有图形化界面就是很糟糕 在命令行执行各种命令都没有问题,说明anaconda并没有出现大的问题,可能只是图形化界面出了问题. 执行 ana ...