ORAchk-数据库健康检查好帮手
ORAchk 之前被称为RACcheck,后来它的检查范围进行了扩展,改名为了ORAchk,它是在数据库系统进行健康检查的一个专用工具,这个工具主要用来检查软件的配置是否符合要求以及一些最佳实践是否被应用了。通过这个工具,用户可以很方便地、自动化地对自己的系统进行健康检查和评估。
ORAchk 能够检查的软件主要有:OS、Oracle Clusterware (CRS)、 Grid Infrastructure environment(GI)、Automatic Storage Management (ASM)以及Real Application Clusters (RAC)、单机的数据库、Golden Gate。
检查的项目包括:
o OS kernel 参数
o OS 包/补丁
o OS上其它和RAC相关的配置
o CRS/Grid Infrastructure
o RDBMS
o ASM
o 数据库参数
o 对于RAC数据库影响较大的设置
o 升级到11.2.0.3/11.2.0.4/12c时的升级检查
o Maximum Availability Architecture (MAA)检查
目前支持的平台:
o Linux x86-64* (Enterprise Linux, RedHat and SuSE 9, SuSE 10 & SuSE 11)
o Oracle Solaris SPARC (64-bit)(Solaris 10 and 11)
o Oracle Solaris x86-64 (Solaris 10 and 11)
o IBM AIX on POWER Systems (64-bit) **
o HP-UX PA-RISC (64-bit)**
o HP-UX Itanium **
* 不支持32位平台,不支持 Linux Itanium
** 需要安装BASH Shell 3.2 或之上
目前支持的数据库版本:
o 10gR2
o 11gR1
o 11gR2
o 12cR1
注:自版本 2.2.0 起,ORAchk 支持单实例、Oracle Restart 以及 RAC(包括 RAC One)
我们推荐使用最新版本的ORAchk,这是因为ORAchk基于最佳实践,这些最佳实践会不断更新,另一方面ORAchk会检查补丁的安装情况,PSU 是按季度推出的,所以ORAchk也会至少每两到三个月更新一次。
1.首先看一下如何下载和安装ORAchk
ORAchk是从下面的My Oracle Support 文档中下载:
ORAchk - Health Checks for the Oracle Stack (Doc ID 1268927.1)
对于RAC环境,只需要在任意一个节点执行ORAchk就可以,它会通过SSH连接到别的节点收集数据,由于它会以sysdba身份登录到数据库中做很多检查,所以要求用数据库软件的属主来执行ORAchk,而且要对oracle用户配置用户等效性,使它能够无需密码就连接到远程节点。
下载之后的文件为orachk.zip。 将这个文件用数据库软件属主上传到RAC集群的任一节点,比如节点1的一个目录:
su - oracle <=======用数据库属主执行
$cd /home/oracle
$mkdir orachk
$cd orachk
$pwd
/home/oracle/orachk <==本例中把orachk.zip上传到了这个目录
$ls -l orachk
-rw-r--r-- 1 oracle oinstall 5237947 May 14 05:15 orachk.zip
$ unzip orachk.zip <==解压这个文件
$ls -l
total 33324
-rw-rw-r-- 1 oracle oinstall 21234729 Mar 1 04:35 collections.dat
-rwxr-xr-x 1 oracle oinstall 1428107 Mar 1 04:34 orachk<==这个文件的权限是755,属主是oracle
-rw-r--r-- 1 oracle oinstall 5237947 May 14 05:15 orachk.zip
-rwxr-xr-x 1 oracle oinstall 1428107 Mar 1 04:34 raccheck
-rw-r--r-- 1 oracle oinstall 2541 Mar 1 04:34 readme.txt
-rw-rw-r-- 1 oracle oinstall 4716612 Mar 1 04:35 rules.dat
-rw-r--r-- 1 oracle oinstall 296 Mar 1 04:34 UserGuide.txt
2. 接下来看一下如何执行orachk
它的执行也是非常简单的,用oracle用户执行:
[oracle@rac1 orachk]$ ./oracheck
CRS stack is running and CRS_HOME is not set. Do you want to set CRS_HOME to /u01/app/11.2.0.4/grid?[y/n][y]y <==确认CRS_HOME是否正确
Checking ssh user equivalency settings on all nodes in cluster
Node rac2 is configured for ssh user equivalency for oracle user
Searching for running databases . . . . .
. .
List of running databases registered in OCR
1. RACDB
2. None of above
Select databases from list for checking best practices. For multiple databases, select 1 for All or comma separated number
like 1,2 etc [1-2][1].1 《===========选择要进行检查的数据库
. .
Checking Status of Oracle Software Stack - Clusterware, ASM, RDBMS
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
-------------------------------------------------------------------------------------------------------
Oracle Stack Status
-------------------------------------------------------------------------------------------------------
Host Name CRS Installed ASM HOME RDBMS Installed CRS UP ASM UP RDBMS UP DB Instance Name
-------------------------------------------------------------------------------------------------------
rac1 Yes Yes Yes Yes Yes Yes RACDB1
rac2 Yes Yes Yes Yes Yes Yes RACDB2
-------------------------------------------------------------------------------------------------------
Copying plug-ins
. . . . . . . . . . . . . . . . . .
. . . . . .
113 of the included audit checks require root privileged data collection . If sudo is not configured or the root password is
not available, audit checks which require root privileged data collection can be skipped.
1. Enter 1 if you will enter root password for each host when prompted
2. Enter 2 if you have sudo configured for oracle user to execute root_raccheck.sh script
3. Enter 3 to skip the root privileged collections
4. Enter 4 to exit and work with the SA to configure sudo or to arrange for root access and run the tool later.
Please indicate your selection from one of the above options for root access[1-4][1]:-1 <=========root密码输入方式,选择1表示手工输入
注:
选项1:在执行阶段根据提示输入root密码
选项2:表示为oracle用户配置了sudo。
选项3:跳过需要使用root权限进行的检查,不推荐。
选项4:退出ORAchk来进行root权限相关的配置。
Is root password same on all nodes?[y/n][y]y 《===root的密码是否在所有节点都一致
Enter root password : <==输入root用户的密码
Verifying root password.
. . .
*** Checking Best Practice Recommendations (PASS/WARNING/FAIL) *** 《========开始进行检查
Collections and audit checks log file is
/home/oracle/raccheck/raccheck_rac1_RACDB_111013_185118/log/raccheck.log
Checking for prompts in /home/oracle/.bash_profile on rac1 for oracle user...
Checking for prompts in /home/oracle/.bash_profile on rac2 for oracle user...
Starting to run raccheck in background on rac2 <==========对远程节点也进行检查
=============================================================
Node name - rac1
=============================================================
Collecting - ASM DIsk I/O stats
Collecting - ASM Disk Groups
Collecting - ASM Diskgroup Attributes
Collecting - ASM disk partnership imbalance
Collecting - ASM diskgroup attributes
Collecting - ASM initialization parameters
完成后,将显示以下(或类似)内容:
Detailed report (html) - /home/oracle/orachk/orachk_rac1_RACDB_111013_185118/orachk_rac1_RACDB_111013_185118.html
UPLOAD(if required) - /home/oracle/orachk/orachk_rac1_RACDB_111013_185118.zip
两个节点一般需要运行10多分钟,每个节点大概需要5分钟。ORAchk占用的资源很少,在我的测试库上大概占用了10%左右的CPU。另外,ORAchk生成的结果一般在5M左右,自动压缩生成的.zip文件大概几百K。
3. 再看一下ORAchk生成的报告
ORAchk 检查完成之后会生成一个html报告,这个报告的命名为:orachk_节点名_数据库名_时间.html,比如orachk_rac1_RACDB_111013_185118.html。同时,它还会把所有的输出文件都打包为一个.zip文件,比如orachk_rac1_RACDB_111013_185118.zip,可以把这个.zip文件从RAC服务器上下载到本地的windows,解压后查看其中的生成的orachk_节点名_数据库名_时间.html 这一个文件就可以。
生成的报告也非常简单、清晰,在报告最上部会列出这次检查的分数,满分是100分。
在html报告中会列出下面的内容:
Findings Needing Attention <==检查失败的项目,分别为FAIL、WARNING、INFO
On Database Server
MAA Scorecard <==MAXIMUM AVAILABILITY ARCHITECTURE,也就是最大可用架构
Findings Passed <==通过的项目
On Database Server
Cluster Wide
GRID and RDBMS patch recommendation Summary report <==补丁检查结果
GRID and RDBMS patch recommendation Detailed report <==推荐打的补丁
对于每一项失败的项目,点击对应的“View"按钮会,会列出这项检查为何失败、这个问题会导致的影响、 推荐的解决方案,相关文档等。
4. ORAchk 升级检查功能
ORAchk 还有一个很赞的功能就是升级前和升级后的检查,当前的ORAchk版本2.2.3_20131007已经支持升级到版本11.2.0.3/11.2.0.4/12c时的升级检查。进行升级检查的目的是为了保障集群和RAC升级的过程尽量平稳和顺利,尽量避免遇到已知的问题。使用ORAchk进行升级检查的好处是它整合了许多升级方面常用的文档,这样就可以统一入口,用ORAchk这个工具进行检查就可以。
升级检查分两个阶段:
o 升级前:
$./orachk -u -o pre
o 升级后:
$./orachk -u -o post
5. 什么时候适宜运行ORAchk呢?
o 在系统负载较低的时候运行,这样对系统影响最小。ORAchk 不会对系统的性能状况进行分析,因此不需要在系统发生性能情况时执行。
o 另外在RAC环境部署完毕之后推荐运行一下来检查一下系统的配置健康情况。
o 还推荐在计划内的维护前和维护后都执行一下
o 在升级前和升级后也要执行
o 在日常维护中,至少每三个月执行一次,因为ORAchk每两到三个月会更新一次
默认方式执行 ./orachk 后只会执行一次,但是可以在执行ORAchk时以自动任务的方式让它定期执行,并发送邮件通知。具体的配置方式请参考ORAchk的用户手册章节“ORAchk Daemon Mode Operation”(也是在MOS文档 1268927.1中下载)。
比如:
首先设置自动任务的参数:
$ ./orachk -set "AUTORUN_INTERVAL=1d;AUTORUN_FLAGS= -o v;NOTIFICATION_EMAIL=firstname.lastname@company.com;PASSWORD_CHECK_INTERVAL=1"
用daemon方式启动ORAchk:
$ ./orachk –d start
ORAchk 不会像OSWatcher一样自动维护它的输出文件,需要手工清除或者设置cron等自动任务来清除。
另外,不可以在一台server上同时启动多个ORAchk,同一时刻只能执行一个ORAchk。
需要注意的是,ORAchk不是诊断工具,不是性能调优工具,也不是数据收集工具,比如RAC节点发生了重启,那么ORAchk不能告诉你重启的原因,它也不会收集诊断重启问题的数据,所以它不能代替RDA ,diagcollection等工具。另外,ORAchk也不能代替cluster verification utility,这是因为他们两个工具是互补的。CVU 是集群自带的工具,而且GI会定时调用CVU来进行一些RAC的检查,但是CVU的版本是确定的,不像ORAchk会定期被更新。
ORAchk的支持是通过MOS的社区来进行的,在RAC/Scalability 这个社区中有一个专门用于ORAchk的帖子RAC/Scalability Community Forum,如果有ORAchk的问题,可以在个帖子提问,注意这个帖子是英文的。还可以在中文数据库社区进行讨论。
我们在2013年11月份进行了一个关于RACcheck的网上讲座,讲座的录像和讲义可以在在MOS文档1456176.1=》“Archived 2013”=》使用RACCheck诊断和预防RAC问题=》点击Recording 或者 .pdf 进行下载.
附:我用目前最新的ORAchk版本进行了测试,单实例上也可以运行ORAchk,下面是在AIX上利用ORAchk对10.2.0.5的单实例数据库进行检查的过程:
$ ./orachk
This computer is for [S]ingle instance database or part of a [C]luster to run RAC database [S|C] [C]:S
raccheck did not find the RDBMS binaries on nascds5 from environment.
Please set RAT_ORACLE_HOME to ORACLE_HOME in current shell to override and re-run it.
eg export RAT_ORACLE_HOME=/u01/app/oracle/product/11.2.0/db_1
$export RAT_ORACLE_HOME=/opt/oracle/products/10.2.0.5
$ ./orachk
This computer is for [S]ingle instance database or part of a [C]luster to run RAC database [S|C] [C]:S
RDBMS binaries found at /opt/oracle/products/10.2.0.5 and ORACLE_HOME not set. Do you want to set ORACLE_HOME to
/opt/oracle/products/10.2.0.5?[y/n][y]y
Checking Status of Oracle Software Stack - Clusterware, ASM, RDBMS
. . . . . . . . .
-------------------------------------------------------------------------------------------------------
Oracle Stack Status
-------------------------------------------------------------------------------------------------------
Host Name CRS Installed ASM HOME RDBMS Installed CRS UP ASM UP RDBMS UP DB Instance Name
-------------------------------------------------------------------------------------------------------
nascds5 No ./raccheck: line 9508: [: -eq: unary operator expected
Yes Yes No No No
-------------------------------------------------------------------------------------------------------
raccheck did not find the Clusterware version from environment.
Please set RAT_DB to cluster version in current shell to override and re- run it.
eg export RAT_DB=112020
$ export RAT_DB=102050
$ ./orachk
This computer is for [S]ingle instance database or part of a [C]luster to run RAC database [S|C] [C]:S
RDBMS binaries found at /opt/oracle/products/10.2.0.5 and ORACLE_HOME not set. Do you want to set ORACLE_HOME to
/opt/oracle/products/10.2.0.5?[y/n][y]y
Checking Status of Oracle Software Stack - Clusterware, ASM, RDBMS
. . . . . . . . .
-------------------------------------------------------------------------------------------------------
Oracle Stack Status
-------------------------------------------------------------------------------------------------------
Host Name CRS Installed ASM HOME RDBMS Installed CRS UP ASM UP RDBMS UP DB Instance Name
-------------------------------------------------------------------------------------------------------
nascds5 No ./raccheck: line 9508: [: -eq: unary operator expected
Yes Yes No No No
-------------------------------------------------------------------------------------------------------
Copying plug-ins
. . . . . . . . . . . . . . . . . .
. . . . . .
*** Checking Best Practice Recommendations (PASS/WARNING/FAIL) ***
Collections and audit checks log file is
/home/oracle/raccheck/raccheck_nascds5_112113_094623/log/raccheck.log
Checking for prompts in /home/oracle/.profile on nascds5 for oracle user...
=============================================================
Node name - nascds5
=============================================================
Collecting - AIX Packages
Collecting - CPU Information
Collecting - Disk Information
Collecting - Memory Information
Collecting - Network tunable parameters
Collecting - OS fixes or patches
Collecting - Patches for RDBMS Home
Collecting - System and Kernel Settings
Data collections completed. Checking best practices on nascds5.
--------------------------------------------------------------------------------------
WARNING => OS Patch IZ97457 is recommended but not installed
FAIL => OS Patch IZ89165 is recommended but not installed
FAIL => OS Patch IZ41855 is recommended but not installed
FAIL => OS Patch IZ52319 is recommended but not installed
FAIL => OS Patch IZ51456 is recommended but not installed
WARNING => kernel paramater tcp_ephemeral_low is not set to recommended value of 9000
WARNING => kernel paramater udp_ephemeral_low is not set to recommended value of 9000
WARNING => kernel paramater maxuproc is not set to recommended value of 13684
WARNING => kernel paramater maxreqs is not set to recommended value of 65536
Best Practice checking completed.Checking recommended patches on nascds5.
---------------------------------------------------------------------------------
---------------------------------------------------------------------------------
---------------------------------------------------------------------------------
RDBMS homes patches summary report
---------------------------------------------------------------------------------
Total patches Applied on RDBMS Applied on ASM ORACLE_HOME
---------------------------------------------------------------------------------
---------------------------------------------------------------------------------
---------------------------------------------------------------------------------
Detailed report (html) - /home/oracle/raccheck/raccheck_nascds5_112113_094623/raccheck_nascds5_112113_094623.html
UPLOAD(if required) - /home/oracle/raccheck/raccheck_nascds5_112113_094623.zip
ORAchk-数据库健康检查好帮手的更多相关文章
- ORAchk - 数据库配置检查工具
1.概要2.下载和安装3.如何执行4.执行过程5.报告6.参考 1.概要 ORAchk之前被称为RACcheck,后来它的检查范围进行了扩展,改名为了ORAchk,它是在数据库系统进行健康检查的一个专 ...
- 【RDA】使用RDA(Remote Diagnostic Agent)工具对数据库进行健康检查
[RDA]使用RDA(Remote Diagnostic Agent)工具对数据库进行健康检查 分类: Linux RDA英文全称叫做"Oracle Remote Diagnostic Ag ...
- Oracle SQL 调优健康检查脚本
Oracle SQL 调优健康检查脚本 我们关注数据库系统的性能,进行数据库调优的主要工作就是进行SQL的优化.良好的数据架构设计.配合应用系统中间件和写一手漂亮的SQL,是未来系统上线后不出现致命性 ...
- SpringBoot之旅 -- SpringBoot 项目健康检查与监控
前言 You build it,You run it, 当我们编写的项目上线后,为了能第一时间知晓该项目是否出现问题,常常对项目进行健康检查及一些指标进行监控. Spring Boot-Actuato ...
- ASP.NET Core之跨平台的实时性能监控(2.健康检查)
前言 上篇我们讲了如何使用App Metrics 做一个简单的APM监控,最后提到过健康检查这个东西. 这篇主要就是讲解健康检查的内容. 没看过上篇的,请移步:ASP.NET Core之跨平台的实时性 ...
- k8s健康检查(七)--技术流ken
默认的健康检查 强大的自愈能力是 Kubernetes 这类容器编排引擎的一个重要特性.自愈的默认实现方式是自动重启发生故障的容器.除此之外,用户还可以利用 Liveness 和 Readiness ...
- SpringBoot 项目健康检查与监控(转)
前言 You build it,You run it, 当我们编写的项目上线后,为了能第一时间知晓该项目是否出现问题,常常对项目进行健康检查及一些指标进行监控.Spring Boot-Actuator ...
- Spring Cloud(Dalston.SR5)--Eureka 服务实例健康检查
默认情况下,Eureka 客户端每隔 30 秒会发送一次心跳给服务器端,告知正常存活,但是,实际环境中有可能出现这种情况,客户端表面上可以正常发送心跳,但实际上服务是不可用的,例如,一个需要访问数据的 ...
- asp.net core 健康检查
asp.net core 健康检查 ASP.NET Core 2.2 开始,提供了健康检查中间件和库,用来报告应用基础结构组件的运行状况.官方文档在此 运行状况检查由应用程序作为 HTTP 终结点公开 ...
随机推荐
- LDAP落地实战(一):OpenLDAP部署及管理维护
公司内部会有许多第三方系统或服务,例如Svn,Git,VPN,Jira,Jenkins等等,每个系统都需要维护一份账号密码以支持用户认证,当然公司也会有许多的主机或服务器,需要开放登录权限给用户登录使 ...
- docker 创建tomcat镜像
Dockerfile ############################################ # version : wenbronk/jdkiu121/tomcat8 # desc ...
- 面试题30:KMP 字符串查找
参考:http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html自己写的很简单的K ...
- yum命令速查
1 yum的基本原理 CentOS可在yum服务器上下载官方网站给出的rpm给出的表头列表数据,该数据除了记载每个rpm软件的相依性之外,也说明了rpm所放置的容器(repository)所在.通过分 ...
- echarts 雷达图的个性化设置
echarts 雷达图的个性化设置 function test() { let myChart = echarts.init(document.getElementById('levelImage') ...
- log4配置
log4j 和 log4j2 方式一:log4j2.xml 添加 jar 包 <!-- log4j-core --> <!-- <dependency> <grou ...
- Golang panic用法
Go语言追求简洁优雅,所以,Go语言不支持传统的 try…catch…finally 这种异常,因为Go语言的设计者们认为,将异常与控制结构混在一起会很容易使得代码变得混乱.因为开发者很容易滥用异常, ...
- 破解栅栏密码python脚本
今天遇到一个要破解的栅栏密码,写了个通用的脚本 #!/usr/bin/env python # -*- coding: gbk -*- # -*- coding: utf_8 -*- # Author ...
- 脚手架(create-react-app)没有eject情况下,使用react-scripts的时候,动态设置环境变量
在实际开发中,例如:有时候打包发布时,需要手动更新版本,比如修改package.json中的version,但是如果有时候忘了修改,那么又得build一次: 如果能动态设置多好,webpack下可以在 ...
- iOS调用系统页面中文显示
在开发的过程中,我们会接入很多的sdk,比如相机,相册,是否允许获取位置等,大多数的情况下是默认显示英文, 在plist文件里面添加一个key就可以了,如下图: key:Localization na ...