专业编程教程与实战项目分享平台

网站首页 > 技术文章 正文

Oracle 11G RAC集群CRS维护 oracle rac维护命令

ins518 2024-11-07 12:04:13 技术文章 15 ℃ 0 评论

Oracle 11G RAC集群CRS维护


CRS 有一整套的工具集,它们都出现在$GRID_HOME/bin 目录下,在$ORACLE_HOME 中也有部分 CRS 工 具可用,但 Oracle 推荐只使用$GRID_HOME/bin 目录下的工具集。常用的有 crsctl、 crs_stat 、 diagcollection.pl、oifcfg 等,下面介绍一些简单的应用。


启动和停止CRS

通常,RAC 环境中的 CRS 都配置成了随机自动启动,但有时候需要调试 CRS,或者 OS 需要维护,或 者需要为 GI 软件打补丁时,需要手工启停 CRS,手工启停 CRS 的命令很简单,与以前版本也是一致的, 开启 CRS:crsctl start crs,关闭 CRS:crsctl stop crs,依旧需要特权用户 root 来完成 CRS 的启停。 11g 还引入了一个命令集来启停所有节点上运行的全部集群资源,包括数据库实例、ASM、VIP 等资源,非常方便:

例如:

停止所有节点上的 css 及资源:

crsctl stop cluster -all

启动所有节点上的 css 及资源:

crsctl start cluster -all


验证 CRS

下面这些命令用来验证集群及其相关进程的状态(以 grid、root 用户执行皆可)。

? 检查一个集群的当前运行状态:

/opt/11.2.0/grid/bin/crsctl check cluster

例如:

[root@node1 bin]# ./crsctl check cluster

CRS-4537: Cluster Ready Services is online

CRS-4529: Cluster Synchronization Services is online

CRS-4533: Event Manager is online


? 检查 CRS 的当前状态:

/opt/11.2.0/grid/bin/crsctl check crs

例如:

[grid@node1 ~]$ crsctl check crs

CRS-4638: Oracle High Availability Services is online

CRS-4537: Cluster Ready Services is online

CRS-4529: Cluster Synchronization Services is online

CRS-4533: Event Manager is online


? 检查 ohasd 进程的状态:

/opt/11.2.0/grid/bin/crsctl check has

例如:

[grid@node1 ~]$ crsctl check has

CRS-4638: Oracle High Availability Services is online


? 检查 ctssd 进程的状态:

/opt/11.2.0/grid/bin/crsctl check ctss

例如:

[grid@node1 ~]$ crsctl check ctss

CRS-4700: The Cluster Time Synchronization Service is in Observer mode.

备注:如果 RAC 时间的同步是采用第三方软件,比中 ntp 方式,那么 ctss 会处于 observer

状态。


禁用与启用CRS


若是不想让 CRS 随机启动,那么可以 disable 它:

/opt/11.2.0/grid/bin/crsctl disable crs

可以 enable:

/opt/11.2.0/grid/bin/crsctl enable crs


显示集群资源状态

这个功能是 11gR2 中 crsctl 新具有的,显示集群资源的状态:

/opt/11.2.0/grid/bin/crsctl stat res -t

该命令与以前的 crs_stat -t 基本类似。


使用 oifcfg 配置集群网络

该命令包含了获取、删除与设置三部分,分别为 oifcfg getif、oifcfg delif、oifcfg setif,更 加具体的语法可以通过 oifcfg -h 来获取到。

例如:

[grid@node1 ~]$ oifcfg getif

eth0 192.168.10.0 global public

eth1 10.10.17.0 global cluster_interconnect


使用 diagcollection 诊断集群

该工具可以帮助 DBA 们一次性收集有关所有必需组件的诊断信息,如主机、操作系统、集群等等, 这个工具位于$GRID_HOME/bin 目录下,默认情况下,该工具将收集完整的诊断信息,但也可以使用正确 的选项只收集想要的信息,如下命令只收集 CRS 的诊断信息:

/oracle/app/grid/product/11.2.0/bin/diagcollection.pl --collect --crs


管理 OCR

OCR 用来存储集群数据库的配置信息,对它的管理操作包括备份、恢复、添加、删除以及迁移等等。


备份OCR

OCR 有自动备份,默认情况下,在集群运行的过程中,每 4 个小时就会对 OCR 进行一次备份,并保留 最后的 3 个备份,每天和每周结束时,也会保留相应的一个备份。有几个命令被用来执行 OCR 备份相关 的各种操作,比如查看 OCR 当前的一些信息并检查 OCR 是否损坏(用 root 用户执行):

/opt/11.2.0/grid/bin/ocrcheck

例如:

[root@node1 bin]# ./ocrcheck

Status of Oracle Cluster Registry is as follows :

Version : 3

Total space (kbytes) : 363120

Used space (kbytes) : 2792 Available space (kbytes) : 259428

ID : 4653961644

Device/File Name : +DATA

Device/File integrity check succeeded Device/File not configured Device/File not configured Device/File not configured Device/File not configured

Cluster registry integrity check succeeded Logical corruption check succeeded

因为 OCR 的重要,备份 OCR 是项非常重要的工作,以下命令查看 OCR 的备份信息:

/opt/11.2.0/grid/bin/ocrconfig -showbackup

切换至 root,使用如下命令可以用来手工备份 OCR 文件(root 用户执行):

/opt/11.2.0/grid/bin/ocrconfig -manualbackup

OCR 的备份文件是一个二进制文件,但是可以使用 ocrdump 命令来查看它的内容(同样需要使用 root 用户):

cd /opt/11.2.0/grid/bin/

./ocrdump -backupfile /opt/11.2.0/grid/cdata/racdb-cluster/backup00.ocr

为了让 word 中的显示不太混乱,先 cd 到了 ocrdump 命令所在的目录,这个命令会在命令执行的工 作目录下生成一个名为 OCRDUMPFILE 的文本文件。


恢复OCR


备份是为了在 OCR 损坏的关键时刻能够对其进行恢复,下面是一个简单的模拟恢复测试(使用 root 用户来执行下面这些命令):

在所有节点上执行如下命令来停止 crs:

/opt/11.2.0/grid/bin/crsctl stop crs

如果 OCR 文件已经损坏,那么上述命令可能会报错,在命令中使用“-f”选项强制关停 crs,然后在 其中一个节点上将 crs 启动到独占模式:

/opt/11.2.0/grid/bin/crsctl start crs -excl

使用 ps 命令来观察,如果 crsd 进程存在,使用如下命令先行关闭该进程:

crsctl stop resource ora.crsd -init

然后再使用 ocrconfig 命令查看备份文件所在的位置,并找合适的备份来恢复 OCR:

/opt/11.2.0/grid/bin/ocrconfig -restore /opt/11.2.0/grid/cdata/racdb-cluster/backup00.ocr

再度使用 ocrcheck 来检查 OCR 的状况,如正常,先将当前节点的 crs 关闭:

/opt/11.2.0/grid/bin/crsctl stop crs -f

crs 可以正常启动了。


OCR镜像维护


当前的 OCR 所在的位置可以通过两个途径得到:一是 ocrcheck 命令,二是/etc/oracle/ocr.loc 文 件,既然 OCR 这么重要,如果使用前面的几个方法得知只有一份 OCR 的话,那么应该考虑为其创建镜像, OCR 只能有一个镜像,也就是说 OCR 磁盘最多有两个,一个 primary ocr,一个 mirror ocr,以下操作都 可以在 crs 运行时进行,依旧使用 root 用户来执行 ocrconfig 命令:

/opt/11.2.0/grid/bin/ocrconfig -add +ASM_demo

这里需要注意一点,在 11.2 版本具是用 ASM 来存放 OCR,用来做 OCR 的 diskgroup,也就是这里的+ASM_demo,需要满足以下条件:

1) 冗余配置为 External 时,至少需要 300M;冗余配置为 Normal 的至少需要 600M;冗余配置为 High 的至少需要 900M;

2) 该磁盘必须在所有节点上挂载;

3) Compatible.asm 参数必须设置至少为 11.2(alter diskgroup +ASM_demo set ATTRIBUTE 'compatible.asm'='11.2';);

4) 所有节点上,GRID_HOME 的权限为“6751”或“-rwsr-s—x”。

下面的命令用来删除多余的 OCR:

/opt/11.2.0/grid/bin/ocrconfig -delete +ASM_demo


移动 OCR

有时在维护时可能会更改 OCR 的磁盘,也就是说将 OCR 从一个磁盘移动到另一个磁盘,那么也是可 以的,只是在移动前必须先给 OCR 添加镜像 OCR,然后再移动,步骤如下:

当前的 OCR 是 DATA,创建镜像 DATADG1,然后移动到 DATADG2

/opt/11.2.0/grid/bin/ocrconfig -add +DATADG1

/opt/11.2.0/grid/bin/ocrconfig -replace +DATADG1 -replacement +DATADG2

值得一提的是,ocrconfig 还有-export 和-import 选项可以用来替代上面的备份与恢复过程。


管理 Voting Disk

从 11gR2 开始,无需对 Voting Disk 进行手工的备份,只要对集群的结构做了任何更改,Voting Disk 会被自动备份到 OCR 中,如果添加了新的 Voting Disk,那么 Oracle 会自动将以前备份的 Voting Disk 数据恢复到新添加的 Voting Disk 中。与 OCR 不同的是,Voting Disk 的管理需要使用 crsctl 命令,下 面的命令用来查询 Voting Disk 的有关信息:

/opt/11.2.0/grid/bin/crsctl query css votedisk

例如:

[grid@node1 ~]$ crsctl query css votedisk

## STATE File Universal Id File Name Disk group

-- ----- ----------------- --------- ---------

1. ONLINE 1ed6e4e28dc94fssbf991a1ff18b818f (ORCL:DATAVG) [DATA] Located 1 voting disk(s).

当 Voting Disk 在 ASM 上的时候,不可以使用 crsctl add/delete css votedisk 命令,唯一可做的操作是可以将 Voting Disk 搬迁到其他的磁盘组上,不过这样的操作看来也没太多的用武之地,除非想 要将其搬迁到冗余度更高的磁盘组上:

/opt/11.2.0/grid/bin/crsctl replace css votedisk +asm_demo

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表