网站首页 > 技术文章 正文
Oracle 11G RAC集群CRS维护
CRS 有一整套的工具集,它们都出现在$GRID_HOME/bin 目录下,在$ORACLE_HOME 中也有部分 CRS 工 具可用,但 Oracle 推荐只使用$GRID_HOME/bin 目录下的工具集。常用的有 crsctl、 crs_stat 、 diagcollection.pl、oifcfg 等,下面介绍一些简单的应用。
启动和停止CRS
通常,RAC 环境中的 CRS 都配置成了随机自动启动,但有时候需要调试 CRS,或者 OS 需要维护,或 者需要为 GI 软件打补丁时,需要手工启停 CRS,手工启停 CRS 的命令很简单,与以前版本也是一致的, 开启 CRS:crsctl start crs,关闭 CRS:crsctl stop crs,依旧需要特权用户 root 来完成 CRS 的启停。 11g 还引入了一个命令集来启停所有节点上运行的全部集群资源,包括数据库实例、ASM、VIP 等资源,非常方便:
例如:
停止所有节点上的 css 及资源:
crsctl stop cluster -all
启动所有节点上的 css 及资源:
crsctl start cluster -all
验证 CRS
下面这些命令用来验证集群及其相关进程的状态(以 grid、root 用户执行皆可)。
? 检查一个集群的当前运行状态:
/opt/11.2.0/grid/bin/crsctl check cluster
例如:
[root@node1 bin]# ./crsctl check cluster
CRS-4537: Cluster Ready Services is online
CRS-4529: Cluster Synchronization Services is online
CRS-4533: Event Manager is online
? 检查 CRS 的当前状态:
/opt/11.2.0/grid/bin/crsctl check crs
例如:
[grid@node1 ~]$ crsctl check crs
CRS-4638: Oracle High Availability Services is online
CRS-4537: Cluster Ready Services is online
CRS-4529: Cluster Synchronization Services is online
CRS-4533: Event Manager is online
? 检查 ohasd 进程的状态:
/opt/11.2.0/grid/bin/crsctl check has
例如:
[grid@node1 ~]$ crsctl check has
CRS-4638: Oracle High Availability Services is online
? 检查 ctssd 进程的状态:
/opt/11.2.0/grid/bin/crsctl check ctss
例如:
[grid@node1 ~]$ crsctl check ctss
CRS-4700: The Cluster Time Synchronization Service is in Observer mode.
备注:如果 RAC 时间的同步是采用第三方软件,比中 ntp 方式,那么 ctss 会处于 observer
状态。
禁用与启用CRS
若是不想让 CRS 随机启动,那么可以 disable 它:
/opt/11.2.0/grid/bin/crsctl disable crs
可以 enable:
/opt/11.2.0/grid/bin/crsctl enable crs
显示集群资源状态
这个功能是 11gR2 中 crsctl 新具有的,显示集群资源的状态:
/opt/11.2.0/grid/bin/crsctl stat res -t
该命令与以前的 crs_stat -t 基本类似。
使用 oifcfg 配置集群网络
该命令包含了获取、删除与设置三部分,分别为 oifcfg getif、oifcfg delif、oifcfg setif,更 加具体的语法可以通过 oifcfg -h 来获取到。
例如:
[grid@node1 ~]$ oifcfg getif
eth0 192.168.10.0 global public
eth1 10.10.17.0 global cluster_interconnect
使用 diagcollection 诊断集群
该工具可以帮助 DBA 们一次性收集有关所有必需组件的诊断信息,如主机、操作系统、集群等等, 这个工具位于$GRID_HOME/bin 目录下,默认情况下,该工具将收集完整的诊断信息,但也可以使用正确 的选项只收集想要的信息,如下命令只收集 CRS 的诊断信息:
/oracle/app/grid/product/11.2.0/bin/diagcollection.pl --collect --crs
管理 OCR
OCR 用来存储集群数据库的配置信息,对它的管理操作包括备份、恢复、添加、删除以及迁移等等。
备份OCR
OCR 有自动备份,默认情况下,在集群运行的过程中,每 4 个小时就会对 OCR 进行一次备份,并保留 最后的 3 个备份,每天和每周结束时,也会保留相应的一个备份。有几个命令被用来执行 OCR 备份相关 的各种操作,比如查看 OCR 当前的一些信息并检查 OCR 是否损坏(用 root 用户执行):
/opt/11.2.0/grid/bin/ocrcheck
例如:
[root@node1 bin]# ./ocrcheck
Status of Oracle Cluster Registry is as follows :
Version : 3
Total space (kbytes) : 363120
Used space (kbytes) : 2792 Available space (kbytes) : 259428
ID : 4653961644
Device/File Name : +DATA
Device/File integrity check succeeded Device/File not configured Device/File not configured Device/File not configured Device/File not configured
Cluster registry integrity check succeeded Logical corruption check succeeded
因为 OCR 的重要,备份 OCR 是项非常重要的工作,以下命令查看 OCR 的备份信息:
/opt/11.2.0/grid/bin/ocrconfig -showbackup
切换至 root,使用如下命令可以用来手工备份 OCR 文件(root 用户执行):
/opt/11.2.0/grid/bin/ocrconfig -manualbackup
OCR 的备份文件是一个二进制文件,但是可以使用 ocrdump 命令来查看它的内容(同样需要使用 root 用户):
cd /opt/11.2.0/grid/bin/
./ocrdump -backupfile /opt/11.2.0/grid/cdata/racdb-cluster/backup00.ocr
为了让 word 中的显示不太混乱,先 cd 到了 ocrdump 命令所在的目录,这个命令会在命令执行的工 作目录下生成一个名为 OCRDUMPFILE 的文本文件。
恢复OCR
备份是为了在 OCR 损坏的关键时刻能够对其进行恢复,下面是一个简单的模拟恢复测试(使用 root 用户来执行下面这些命令):
在所有节点上执行如下命令来停止 crs:
/opt/11.2.0/grid/bin/crsctl stop crs
如果 OCR 文件已经损坏,那么上述命令可能会报错,在命令中使用“-f”选项强制关停 crs,然后在 其中一个节点上将 crs 启动到独占模式:
/opt/11.2.0/grid/bin/crsctl start crs -excl
使用 ps 命令来观察,如果 crsd 进程存在,使用如下命令先行关闭该进程:
crsctl stop resource ora.crsd -init
然后再使用 ocrconfig 命令查看备份文件所在的位置,并找合适的备份来恢复 OCR:
/opt/11.2.0/grid/bin/ocrconfig -restore /opt/11.2.0/grid/cdata/racdb-cluster/backup00.ocr
再度使用 ocrcheck 来检查 OCR 的状况,如正常,先将当前节点的 crs 关闭:
/opt/11.2.0/grid/bin/crsctl stop crs -f
crs 可以正常启动了。
OCR镜像维护
当前的 OCR 所在的位置可以通过两个途径得到:一是 ocrcheck 命令,二是/etc/oracle/ocr.loc 文 件,既然 OCR 这么重要,如果使用前面的几个方法得知只有一份 OCR 的话,那么应该考虑为其创建镜像, OCR 只能有一个镜像,也就是说 OCR 磁盘最多有两个,一个 primary ocr,一个 mirror ocr,以下操作都 可以在 crs 运行时进行,依旧使用 root 用户来执行 ocrconfig 命令:
/opt/11.2.0/grid/bin/ocrconfig -add +ASM_demo
这里需要注意一点,在 11.2 版本具是用 ASM 来存放 OCR,用来做 OCR 的 diskgroup,也就是这里的+ASM_demo,需要满足以下条件:
1) 冗余配置为 External 时,至少需要 300M;冗余配置为 Normal 的至少需要 600M;冗余配置为 High 的至少需要 900M;
2) 该磁盘必须在所有节点上挂载;
3) Compatible.asm 参数必须设置至少为 11.2(alter diskgroup +ASM_demo set ATTRIBUTE 'compatible.asm'='11.2';);
4) 所有节点上,GRID_HOME 的权限为“6751”或“-rwsr-s—x”。
下面的命令用来删除多余的 OCR:
/opt/11.2.0/grid/bin/ocrconfig -delete +ASM_demo
移动 OCR
有时在维护时可能会更改 OCR 的磁盘,也就是说将 OCR 从一个磁盘移动到另一个磁盘,那么也是可 以的,只是在移动前必须先给 OCR 添加镜像 OCR,然后再移动,步骤如下:
当前的 OCR 是 DATA,创建镜像 DATADG1,然后移动到 DATADG2
/opt/11.2.0/grid/bin/ocrconfig -add +DATADG1
/opt/11.2.0/grid/bin/ocrconfig -replace +DATADG1 -replacement +DATADG2
值得一提的是,ocrconfig 还有-export 和-import 选项可以用来替代上面的备份与恢复过程。
管理 Voting Disk
从 11gR2 开始,无需对 Voting Disk 进行手工的备份,只要对集群的结构做了任何更改,Voting Disk 会被自动备份到 OCR 中,如果添加了新的 Voting Disk,那么 Oracle 会自动将以前备份的 Voting Disk 数据恢复到新添加的 Voting Disk 中。与 OCR 不同的是,Voting Disk 的管理需要使用 crsctl 命令,下 面的命令用来查询 Voting Disk 的有关信息:
/opt/11.2.0/grid/bin/crsctl query css votedisk
例如:
[grid@node1 ~]$ crsctl query css votedisk
## STATE File Universal Id File Name Disk group
-- ----- ----------------- --------- ---------
1. ONLINE 1ed6e4e28dc94fssbf991a1ff18b818f (ORCL:DATAVG) [DATA] Located 1 voting disk(s).
当 Voting Disk 在 ASM 上的时候,不可以使用 crsctl add/delete css votedisk 命令,唯一可做的操作是可以将 Voting Disk 搬迁到其他的磁盘组上,不过这样的操作看来也没太多的用武之地,除非想 要将其搬迁到冗余度更高的磁盘组上:
/opt/11.2.0/grid/bin/crsctl replace css votedisk +asm_demo
猜你喜欢
- 2024-11-07 冒用有效签名:Clop勒索病毒这股”韩流“已入侵国内企业
- 2024-11-07 Oracle 11g 单机环境安装补丁实战
- 2024-11-07 Oracle 一键巡检自动生成 Word 报告
你 发表评论:
欢迎- 617℃几个Oracle空值处理函数 oracle处理null值的函数
- 610℃Oracle分析函数之Lag和Lead()使用
- 599℃0497-如何将Kerberos的CDH6.1从Oracle JDK 1.8迁移至OpenJDK 1.8
- 595℃Oracle数据库的单、多行函数 oracle执行多个sql语句
- 591℃Oracle 12c PDB迁移(一) oracle迁移到oceanbase
- 582℃【数据统计分析】详解Oracle分组函数之CUBE
- 572℃最佳实践 | 提效 47 倍,制造业生产 Oracle 迁移替换
- 560℃Oracle有哪些常见的函数? oracle中常用的函数
- 最近发表
-
- PageHelper - 最方便的 MyBatis 分页插件
- 面试二:pagehelper是怎么实现分页的,
- MyBatis如何实现分页查询?(mybatis-plus分页查询)
- SpringBoot 各种分页查询方式详解(全网最全)
- 如何在Linux上运行exe文件,怎么用linux运行windows软件
- 快速了解hive(快速了解美国50个州)
- Python 中的 pyodbc 库(pydbclib)
- Linux搭建Weblogic集群(linux weblogic部署项目步骤)
- 「DM专栏」DMDSC共享集群之部署(一)——共享存储配置
- 故障分析 | MySQL 派生表优化(mysql pipe)
- 标签列表
-
- 前端设计模式 (75)
- 前端性能优化 (51)
- 前端模板 (66)
- 前端跨域 (52)
- 前端缓存 (63)
- 前端aes加密 (58)
- 前端脚手架 (56)
- 前端md5加密 (54)
- 前端路由 (61)
- 前端数组 (73)
- 前端js面试题 (50)
- 前端定时器 (59)
- 前端获取当前时间 (50)
- Oracle RAC (76)
- oracle恢复 (77)
- oracle 删除表 (52)
- oracle 用户名 (80)
- oracle 工具 (55)
- oracle 内存 (55)
- oracle 导出表 (62)
- oracle约束 (54)
- oracle 中文 (51)
- oracle链接 (54)
- oracle的函数 (58)
- 前端调试 (52)
本文暂时没有评论,来添加一个吧(●'◡'●)