1.1.1. DELLserver硬件监控和DELL系统管理工具OMSA介绍

本文介绍了利用使用Nagios和OMSA显示器DELLserver硬件健康状况,Nagios监控的方式是NRPE模式,须要配置check_openmanage脚本和安装DELL的OMSA工具。

使用OpenManage和Nagios监控DELLserver硬件部署手冊:

http://folk.uio.no/trondham/software/check_openmanage.html

1)        OMSA是什么

OMSA是Dell Openmanage Server Administrator的缩写。

Dell OpenManage Server Administrator (OMSA) provides acomprehensive, one-to-one systems management solution in two ways: from anintegrated, web browser-based graphical user interface (GUI) and from a commandline interface (CLI) through the operating system.
Server Administrator isdesigned for system administrators to manage systems locally and remotely on anetwork. It allows system administrators to focus on managing their entirenetwork by providing comprehensive one-to-one systems management.

2)        安装OMSA

DELL OpenManage的yum源地址:

http://linux.dell.com/repo/hardware/Linux_Repository_14.04.00/

配置OMSA的yum源:

创建/etc/yum.repos.d/dell-omsa-repository.repo源文件:

或者

运行命令自己主动配置:

wget -q -O -http://linux.dell.com/repo/hardware/Linux_Repository_14.04.00/bootstrap.cgi |bash

安装OMSA:

yum install srvadmin-all

配置OMSA服务开机自己主动:

/opt/dell/srvadmin/sbin/srvadmin-services.sh enable

启动OMSA的服务:

/opt/dell/srvadmin/sbin/srvadmin-services.sh start

查看omsa的服务状态:

/opt/dell/srvadmin/sbin/srvadmin-services.sh status

dell_rbu(module) is running

ipmidriver is running

dsm_sa_datamgrd(pid 1331 1197) is running

dsm_sa_eventmgrd(pid 1381) is running

dsm_sa_snmpd(pid 1440) is running

dsm_om_shrsvcd(pid 1508) is running...

dsm_om_connsvcd(pid  1562) is running...

查看omsa的服务的监听状态:

# netstat -npae | egrep -iv'mysql|ssh|xinetd|udevd|crond|syslogd|upstart|auditd'

我们注意到dsm_om_connsvc服务监听了TCP协议的1311port,而且提供了http訪问的功能。

3)        卸载OMSA工具包中的web组件

因为本案例中仅仅须要使用OMSA工具包监控硬件健康状态的功能。不须要使用OMSA提供的Web管理功能,所以为了避免因为系统防火墙或者web管理不当导致的问题,我们在本例中卸载掉OMSA的web组件。

查看OMSA组件的监听情况:

# netstat -npae | egrep -iv 'mysql|ssh|xinetd|udevd|crond|syslogd|upstart|auditd'

ActiveInternet connections (servers and established)

ProtoRecv-Q Send-Q Local Address              Foreign Address            State       User       Inode      PID/Program name

tcp        0     0 :::1311                     :::*                        LISTEN      0         656427     1563/dsm_om_connsvc

ActiveUNIX domain sockets (servers and established)

ProtoRefCnt Flags       Type       State         I-Node PID/Program name    Path

unix  2     [ ACC ]     STREAM    LISTENING     6555231197/dsm_sa_datamgr /opt/dell/srvadmin/var/lib/openmanage/.ipc/dcsmilpipea

unix  2     [ ACC ]     STREAM     LISTENING     655525 1197/dsm_sa_datamgr/opt/dell/srvadmin/var/lib/openmanage/.ipc/dcsmilpipep

unix  2     [ ACC ]     STREAM     LISTENING     655527 1197/dsm_sa_datamgr/opt/dell/srvadmin/var/lib/openmanage/.ipc/dcsmilpipeu

unix  2     [ ACC ]     STREAM     LISTENING     655770 1508/dsm_om_shrsvcd/opt/dell/srvadmin/var/lib/openmanage/shrsvc/dsm_om_shrsvc

unix  2     [ ACC ]     STREAM     LISTENING     655772 1508/dsm_om_shrsvcd/opt/dell/srvadmin/var/lib/openmanage/shrsvc/omintf5e4

unix  2     [ ]         STREAM     CONNECTED     656423 1563/dsm_om_connsvc

unix  2     [ ]         STREAM     CONNECTED     656015 1563/dsm_om_connsvc

unix  3     [ ]         STREAM     CONNECTED     655972 1197/dsm_sa_datamgr/opt/dell/srvadmin/var/lib/openmanage/.ipc/dcsmilpipea

unix  3     [ ]         STREAM     CONNECTED     655971 1563/dsm_om_connsvc

unix  3     [ ]         STREAM     CONNECTED     655650 1197/dsm_sa_datamgr/opt/dell/srvadmin/var/lib/openmanage/.ipc/dcsmilpipea

unix  3     [ ]         STREAM     CONNECTED     655649 1440/dsm_sa_snmpd

unix  3     [ ]         STREAM     CONNECTED     655589 1197/dsm_sa_datamgr/opt/dell/srvadmin/var/lib/openmanage/.ipc/dcsmilpipea

unix  3      [ ]         STREAM     CONNECTED     655588 1381/dsm_sa_eventmg

OMSA组件的dsm_om_connsvc服务监听了TCP协议的1311port。

查看dsm_om_connsvc服务调用的程序:

lsof -p 1563  # 1563是dsm_om_connsvc服务进程的PID

查看dsm_om_connsvc调用的程序文件属于哪个rpm包:

# rpm -qf /opt/dell/srvadmin/lib64/openmanage/apache-tomcat/lib/tomcat-api.jar

srvadmin-tomcat-7.4.0-4.97.1.el6.x86_64

# rpm -qf /opt/dell/srvadmin/lib64/openmanage/jre/lib/jce.jar

srvadmin-jre-7.4.0-4.98.1.el6.x86_64

关闭OMSA的服务:

/opt/dell/srvadmin/sbin/srvadmin-services.sh stop

卸载srvadmin-tomcat和srvadmin-jre软件包:

# rpm -e srvadmin-tomcat-7.4.0-4.97.1.el6.x86_64

error: Failed dependencies:

srvadmin-tomcat = 7.4.0 is needed by (installed)srvadmin-webserver-7.4.0-4.1.1.el6.x86_64

# rpm -e srvadmin-webserver-7.4.0-4.1.1.el6.x86_64

error: Failed dependencies:

srvadmin-webserver = 7.4.0 is needed by (installed)srvadmin-all-7.4.0-4.1.1.el6.x86_64

卸载srvadmin-webserver软件包:

# rpm -e --nodeps srvadmin-webserver-7.4.0-4.1.1.el6.x86_64

# rpm -e srvadmin-tomcat-7.4.0-4.97.1.el6.x86_64

# rpm -e srvadmin-jre-7.4.0-4.98.1.el6.x86_64

删除appache-tomcat的文件夹:

# rm -rf /opt/dell/srvadmin/lib64/openmanage/apache-tomcat

启动OMSA的服务:

# /opt/dell/srvadmin/sbin/srvadmin-services.sh start

StartingSystems Management Device Drivers:

Startingdell_rbu:                                         [  OK  ]

Startingipmi driver: Already started                      [  OK  ]

StartingSystems Management Data Engine:

Startingdsm_sa_datamgrd:                                  [  OK  ]

Startingdsm_sa_eventmgrd:                                 [  OK  ]

Startingdsm_sa_snmpd:                                     [  OK  ]

Starting DSMSA Shared Services:                          [  OK  ]

測试check_openmanage脚本:

./check_openmanage -d

输出的检查项跟卸载OMSA的web组件之前是一样的。

查看卸载OMSA的web组件之后,OMSA的服务监听情况:

# netstat -npae | egrep -iv'mysql|ssh|xinetd|udevd|crond|syslogd|upstart|auditd'

此时,OMSA的服务仅仅进行了Unix domain sockets的监听,而Unix domain socket仅仅用于本操作系统中。进程之间的通信,比方check_openmanage脚本调用OMSA的服务进行DELLserver硬件健康状态检查。

至此。OMSA的Web组件卸载完成。

4)        安装check_openmanage安装包

下载地址:

http://folk.uio.no/trondham/software/check_openmanage.html#download

下载check_openmanage工具包:

wget http://folk.uio.no/trondham/software/files/check_openmanage-3.7.11.tar.gz

測试check_openmanage工具:

tar zxf check_openmanage-3.7.11.tar.gz

cd check_openmanage-3.7.11

./check_openmanage -d

./check_openmanage

假设提示"Storage Error",则加上--no-storage參数:

./check_openmanage --no-storage

# check_openmanage会检查50~60项左右DELL服务的信息

5)        配置NRPE

编辑/usr/local/nagios/etc/nrpc.cfg文件,加入:

command[check_dell_openmanage]=/path/to/check_openmanage

或者

command[check_dell_openmanage]=/path/to/check_openmanage--no-storage

把check_openmanage脚本复制到/usr/local/nagios/libexec/文件夹:

cp check_openmanage-3.7.11/check_openmanage/usr/local/nagios/libexec/

測试命令:

check_nrpe -H IP -c check_dell_openmanage

6)        注意事项

check_openmanage是perl脚本,所以操作系统必须已经安装了perl。

7)        server没有外网怎么办

假设server没有外网。能够考虑在有外网的机器上做一个iptables的nat映射。把仅仅有内网的server配置的yum映射到公网,或者在机房内部署一个yum源;

8)        还能够用什么方法

假设不使用OMSA和check_openmanage来监控硬件健康状态,还能够使用ipmitool来监控,只是须要自己开发脚本。

9)        适用什么环境使用

假设在使用DELL厂商的server。都建议使用。

10)    关于OMSA组件安全性的补充说明

Dell OpenManage Server Administrator (OMSA) 7.1及更早版本号在实现上存在XSS漏洞,可同意远程攻击者注入Web脚本或HTML。

DELL厂商已经公布了升级补丁来修复这个安全问题,请到厂商的主页下载,详见本文最后一部分的“本文相关资料的參考链接”部分的“OMSA组件安全补丁的下载地址”。

11)    DELL厂商提供的其他系统管理工具

DELL还提供用于Microsoft System Center管理配置工具、OracleEntreprise Manager 12c插件。以及支持HP和IBM的插件等工具。详情请登录DELL官方站点,依次进入Support--> Drivers & Downloads --> 选择server类型--> System Managements模块。

12)    DELL提供的用于OracleEnterprise Manager 12c的插件说明

Dell OpenManage Plug-in v1.0 for Oracle Enterprise Manager12c

Dell OpenManage Plug-in for Oracle Enterprise Managerprovides a proactive approach to data center management that delivers featuresfor monitoring Dell server, storage, and networking infrastructures inenvironment managed by Oracle Enterprise Manager (OEM).
It also supportsmapping of database workload to Dell hardware for quicker fault detection andconsole launch of Dell devices to perform troubleshooting, configuration, andmanagement activities. It protects customer’s existing investment in OEM consoleand helps
in ease of integration and management of Dell devices.

13)    什么是Unix domain socket

A Unixdomain socket or IPC socket (inter-process communication socket) is a datacommunications endpoint for exchanging data between processes executing withinthe same host operating system. While similar in functionality to named pipes,Unix domain sockets
may be created as connection‑mode(SOCK_STREAM or SOCK_SEQPACKET) or as connectionless (SOCK_DGRAM), while pipesare streams only. Processes using Unix domain sockets do not need to share acommon ancestry. The API for Unix domain sockets is similar to that of
anInternet socket, but it does not use an underlying network protocol forcommunication. The Unix domain socket facility is a standard component of POSIXoperating systems.Unixdomain sockets use the file system as their address name space. They arereferenced
by processes as inodes in the file system. This allows two processesto open the same socket in order to communicate. However, communication occursentirely within the operating system kernel.In addition to sending data, processes may send filedescriptors across
a Unix domain socket connection using the sendmsg() andrecvmsg() system calls.

14)    本文相关资料的參考链接

自己定义check_openmanage的阀值:

http://dreamway.blog.51cto.com/1281816/1048274

omreport命令使用:

http://www.sxszjzx.com/~t096/manual/sc/Dosa/CLI/report.htm

DELL厂商网址:

http://www.dell.com/support/drivers/us/en/04/ProductSelector/Select/FamilySelection?CategoryPath=all-products%2Fesuprt_ser_stor_net%2Fesuprt_poweredge&Family=PowerEdge&DisplayCrumbs=Product%2520Type%40%2CServers%252C%2520Storage%252C%2520%2526%2520Networking%40%2CPowerEdge&rquery=na

DELL厂商OMSA的yum源地址:

http://linux.dell.com/repo/hardware/Linux_Repository_14.04.00/

使用OpenManage和Nagios监控DELLserver硬件部署手冊:

http://folk.uio.no/trondham/software/check_openmanage.html

OMSA组件安全补丁的下载地址:

http://www.dell.com/support/drivers/us/en/19/DriverDetails/Product/poweredge-r710?

driverId=5JDN0&osCode=WNET&fileId=3082293694

http://www.dell.com/support/drivers/us/en/19/DriverDetails/Product/poweredge-r710?driverId=PCXMR&osCode=WNET&fileId=3082295344

http://www.dell.com/support/drivers/us/en/19/DriverDetails/Product/poweredge-r710?driverId=JJMWP&osCode=WNET&fileId=3082295338

DELL提供的用于Oracle Enterprise Manager 12c的插件地址:

driverId=XKRM6&osCode=WS8R2&fileId=3356540401&languageCode=en&categoryId=SM">http://www.dell.com/support/drivers/us/en/04/DriverDetails/Product/poweredge-r710?

driverId=XKRM6&osCode=WS8R2&fileId=3356540401&languageCode=en&categoryId=SM

DELL厂商提供的其他管理工具的网址:

http://www.dell.com/support/drivers/us/en/04/ProductSelector/Select/FamilySelection?

CategoryPath=all-products%2Fesuprt_ser_stor_net%2Fesuprt_poweredge&Family=PowerEdge&DisplayCrumbs=Product%2520Type%40%2CServers%252C%2520Storage%252C%2520%2526%2520Networking%40%2CPowerEdge&rquery=na

Unix domain socket的解释说明:

http://en.wikipedia.org/wiki/Unix_domain_socket

版权声明:本文博客原创文章。博客,未经同意,不得转载。

【硬件】DELLserver硬件监控和DELL系统管理工具OMSA介绍的更多相关文章

  1. 【硬件】DELLserver硬件监控及DELL系统管理工具OMSA介绍

    1.1.1. DELLserver硬件监控及DELL系统管理工具OMSA介绍 本文介绍採用使用Nagios和OMSA监控DELLserver的硬件健康状态,Nagios监控的方式是NRPE模式,须要配 ...

  2. DELL RACADM 工具使用介绍

    如果iDRAC的IP或者设置出现问题,不能够链接,那么可以通过RACADM这个程序在系统层面可以对iDRAC进行设置,使用的方法以及命令都在下边. RACADM provides command li ...

  3. Linux 基于WEB开源的系统管理工具webmin

    Webmin是目前功能最强大的基于Web的Unix系统管理工具.管理员通过浏览器访问Webmin的各种管理功能并完成相应的管理动作.目前Webmin支持绝大多数的Unix系统,这些系统除了各种版本的l ...

  4. Dell服务器安装OpenManage(OMSA)

    公司上架了一批戴尔服务器,公司要求对这些服务器的硬件做一系列的监控,如CPU的温度,内存,风扇的状态,转速,磁盘等硬件的监控. 在对服务器的硬件监控上,目前业界主要基于如下两种: 1.服务器自带的工具 ...

  5. Windows系统内存分析工具的介绍

      Windows系统内存分析工具的介绍(进程管理器,资源管理器,性能监视器, VMMap, RamMap,PoolMon) 微软官方提供多种工具来分析Windows 的内存使用情况,除了系统自带的任 ...

  6. [原创]Studio 3T mogodb数据库工具使用介绍

    [原创]Studio 3T  mogodb数据库工具使用介绍 1 Studio 3T 简介 Studio 3T是一款功能强大的mangodb工具,主要为用户提供网页设计.代码输入.编程管理.数据库编辑 ...

  7. percona-toolkit工具使用介绍

    percona-toolkit工具使用介绍 1. pt-heartbeat 1.1 pt-heartbeat 原理 1.2 pt-heartbeat 主要参数介绍 1.3 pt-heartbeat 实 ...

  8. [原创]Emmagee V2.4工具使用介绍

    [原创]Emmagee V2.4工具使用介绍 1 Emmagee 介绍 Emmagee 是网易杭州研究院 QA团队开发的一款简单易上手的Android性能监控App,主要用于监控单个App的CPU.内 ...

  9. 星型数据仓库olap工具kylin介绍

    星型数据仓库olap工具kylin介绍 数据仓库是目前企业级BI分析的重要平台,尤其在互联网公司,每天都会产生数以百G的日志,如何从这些日志中发现数据的规律很重要. 数据仓库是数据分析的重要工具, 每 ...

随机推荐

  1. HTTP协议中返回代码302的情况

    http协议中,返回状态码302表示重定向. 这样的情况下,server返回的头部信息中会包括一个 Location 字段,内容是重定向到的url

  2. 坑爹BUG,没有详细的看还真看不出问题

    Queue queue = new LinkedList<String> (); for(int i = 0; i<20; i++) { queue.add("坑爹&quo ...

  3. 左右v$datafile和v$tempfile中间file#

    v$datafile关于存储在文件中的数据视图的信息,v$tempfile查看存储在一个临时文件中的信息. 有两种观点file#现场,首先来看看官方文件的定义: V$DATAFILE This vie ...

  4. Android开发在路上:少去踩坑,多走捷径(转)

    最近一朋友提了几个Android问题让我帮忙写个小分享,我觉得对新人还是挺有帮助的,所以有了这个小分享. 1. 目前, Android APP开发完成后,通常需要在哪些机型上进行测试? 2. 目前, ...

  5. Cocos2d-x3.3它DrawPrimitivesTest分析

    1.代码列表 2.VisibleRect类 该类是test-cpp自带工具类 3.HelloWorldScene类 同前面代码 4.DrawPrimitivesDemo类 1).h文件 #includ ...

  6. Web 服务器 (IIS) 角色

    原文:Web 服务器 (IIS) 角色 1. 对于默认安装,请在命令行提示符下键入以下命令,然后按 Enter: start /w pkgmgr /iu:IIS-WebServerRole;WAS-W ...

  7. RabbitHub开源

    RabbitHub开源情况及计划   之前写过一篇”.NET 平台下的插件化开发内核(Rabbit Kernel)”,已经过去三个月了,期间RabbitHub并不是没有了发展更不是放弃了发展,在Rab ...

  8. linux_安装_安装编译phantomjs 2.0的方法_转

    项目中要对数据公式webkit渲染,phantmjs 2.0的效果好比1.9好不少. 安装过程中 坑比较多. 转载文章: phantomjs 2.0最新版的官方不提供编译好的文件下载,只能自己编译,有 ...

  9. crawler_工具类_RegexUtils_正则帮助类

    package com.cph.crawler.core.utils; import java.util.ArrayList; import java.util.List; import java.u ...

  10. python_基础学习_04_mysql库验证与安装(mysql-python,mysql.connector)

    验证python-mysql是否安装 1:python 2: import MySQLdb 安装步骤: 1.sudo apt-get install python-setuptools 2.sudo ...