网站首页 > 技术文章 正文
今天巡检,发现 一个机器gi 对应的目录/u01空间达到60G,其他机器正常,
通过du -sk 进一步发现,$GRID_HOME/cdata(该目录默认是存放olr和ocr的自动备份和手工备份)下的ocr自动备份有异常,很多number{n}.ocr文件,
-rw------- 1 grid:oinstall 6766592 Nov 10 22:17 week.ocr
-rw------- 1 grid:oinstall 6766592 Nov 10 22:17 day.ocr
-rw------- 1 grid:oinstall 6766592 Nov 11 02:17 day_.ocr
-rw------- 1 grid:oinstall 6766592 Nov 11 02:17 backup02.ocr
-rw------- 1 grid:oinstall 6766592 Nov 11 06:17 backup01.ocr
-rw------- 1 grid:oinstall 6766592 Nov 11 10:17 backup00.ocr
-rw------- 1 root system 7094272 Nov 11 18:21 91530747.ocr
-rw------- 1 root system 7426048 Nov 11 22:21 20587917.ocr
-rw------- 1 root system 7426048 Nov 12 02:21 29546896.ocr
看出ocr的自动备份产生的新的备份文件名称为number{n}.ocr的文件,也就是自动备份出现异常,是个BUG? , 使用ocrconfig -showbackup列出的备份文件还是正常的文件, 对比正常系统的文件的状态和属性,发现文件的属组不一样,难道是在安装过程中出现问题,就是rootcrs.pl(root.sh)在修改文件权限的时候出现问题;
Due to bug 9446443, automatic OCR backups are incorrectly owned which is preventing CRSD from overwriting them.
Expected ownership and permission on Linux - all 7 of them:
-rw------- 1 root root 11640832 Aug 30 08:46 backup00.ocr
-rw------- 1 root root 11640832 Aug 30 04:46 backup01.ocr
-rw------- 1 root root 11640832 Aug 30 00:46 backup02.ocr
-rw------- 1 root root 11640832 Aug 30 00:46 day_.ocr
-rw------- 1 root root 11640832 Aug 29 00:46 day.ocr
-rw------- 1 root root 11640832 Aug 26 00:45 week_.ocr
-rw------- 1 root root 11640832 Aug 19 00:44 week.ocr
有一个BUG,bug 9446443 is fixed in 11.2.0.2, 12.1.
It's recommended to apply patch to fix the issue, but if patch is unavailable, workaround is to change ownership and permission of all 7 automatic backup files manually. OCR should be owned by root, but depend on platform, group may or may not be root - you can check any randomly named backup file to identify what ownership and permission it should have; in example below:
-rw------- 1 root root 7143424 Aug 30 09:40 38455890.ocr
With this, please change all 7 automatic backup files to be owned by root:root with permission "-rw-------"
根据文档介绍,再结合自己的坏境的情况,查看对应crs的操作日志:
2016-03-16 06:24:59.079: [UiServer][12081]{1:19564:21073} Done for ctx=11191c2f0
2016-03-16 06:25:54.968: [ OCRRAW][3599]th_delete_backupfile: Failed to delete the backup file [/grid/product/11.2.0/gridhome_1/cdata/c4bidb-cluster/backup02.ocr] Retval:[-2]
2016-03-16 06:25:54.968: [ OCRSRV][3599]th_delete_backupfile: Failed to delete the backup file:[backup02.ocr] Location:[/grid/product/11.2.0/gridhome_1/cdata/c4bidb-cluster]
2016-03-16 06:25:55.026: [ OCRRAW][3599]proprbkp_rename: Failed to rename the backup file [/grid/product/11.2.0/gridhome_1/cdata/c4bidb-cluster/backup01.ocr] Retval:[1]
2016-03-16 06:25:55.026: [ OCRSRV][3599]th_rename_backupfile: Failed to rename the backup file:[backup01.ocr] Location:[/grid/product/11.2.0/gridhome_1/cdata/c4bidb-cluster]. Retval:[49]
2016-03-16 06:25:55.030: [ OCRRAW][3599]proprbkp_rename: Failed to rename the backup file [/grid/product/11.2.0/gridhome_1/cdata/c4bidb-cluster/backup00.ocr] Retval:[1]
2016-03-16 06:25:55.030: [ OCRSRV][3599]th_rename_backupfile: Failed to rename the backup file:[backup00.ocr] Location:[/grid/product/11.2.0/gridhome_1/cdata/c4bidb-cluster]. Retval:[49]
2016-03-16 06:25:55.033: [ OCRRAW][3599]proprbkp_rename: Failed to rename the backup file [/grid/product/11.2.0/gridhome_1/cdata/c4bidb-cluster/16654495.ocr] Retval:[1]
2016-03-16 06:25:55.033: [ OCRSRV][3599]th_rename_backupfile: Failed to rename the backup file:[16654495.ocr] Location:[/grid/product/11.2.0/gridhome_1/cdata/c4bidb-cluster]. Retval:[49]
2016-03-16 06:25:55.036: [ OCRSRV][3599]th_manipulate_backups: Failed to rename the temporary backup file [16654495.ocr].
日志上在对ocr自动备份的过程中,需要删除老文件,创建新的文件,但是crs操作失败,而产生性的默认文件名来代替
通过上面的列出,应该确定是由于文件权限导致问题,不是本文中提到的BUG,单纯是权限问题;
解决方法是修改默认备份文件名的权限为root:system,且手工删除number{n}.ocr的文件, 观察每4小时的备份正常,且集群状态正常;
这个问题,根因,就是操作失误,本来在一台新机器上进行安装,结果,在连接到正在运行的主机上操作,
比如 chown -R grid:oinstall /u01/app ,chmod 755 /u01/app
之后,就crs出现问题了。通过一些处理,crs可以正常了,但其他一些目录没有修改,导致存在隐患。
猜你喜欢
- 2024-10-22 OpenAI 将使用 Oracle 的芯片进行更多 AI 计算
- 2024-10-22 Ubuntu 16.04 很可能因为 ZFS 跟 Oracle 杠上
- 2024-10-22 Oracle(拉里.埃里森):用AI让所有公民都保持最佳行为”
- 2024-10-22 docker 安装 oracle-11g && oracle 自增id实现之序列
- 2024-10-22 Oracle采用自己的公有云作为ZFS阵列的后端存储
- 2024-10-22 天秤座二月份综合分析,自己的行动力会比较被动的状态
- 2024-10-22 Centos6.0 64位版本上安装oracle11g教程
- 2024-10-22 虚拟机VMware与主机之间文件共享设置,您没有查看X内容所需的权限
- 2024-10-22 OpenJDK和OracleJDK的区别 openjdk 和jdk
- 2024-10-22 第1章 Oracle 第一天 oracle上一天
你 发表评论:
欢迎- 534℃Oracle分析函数之Lag和Lead()使用
- 532℃Oracle数据库的单、多行函数 oracle执行多个sql语句
- 531℃几个Oracle空值处理函数 oracle处理null值的函数
- 523℃0497-如何将Kerberos的CDH6.1从Oracle JDK 1.8迁移至OpenJDK 1.8
- 522℃Oracle 12c PDB迁移(一) oracle迁移到oceanbase
- 507℃【数据统计分析】详解Oracle分组函数之CUBE
- 489℃最佳实践 | 提效 47 倍,制造业生产 Oracle 迁移替换
- 485℃Oracle有哪些常见的函数? oracle中常用的函数
- 最近发表
- 标签列表
-
- 前端设计模式 (75)
- 前端性能优化 (51)
- 前端模板 (66)
- 前端跨域 (52)
- 前端缓存 (63)
- 前端react (48)
- 前端aes加密 (58)
- 前端脚手架 (56)
- 前端md5加密 (54)
- 前端富文本编辑器 (47)
- 前端路由 (61)
- 前端数组 (73)
- 前端排序 (47)
- 前端密码加密 (47)
- Oracle RAC (73)
- oracle恢复 (76)
- oracle 删除表 (48)
- oracle 用户名 (74)
- oracle 工具 (55)
- oracle 内存 (50)
- oracle 导出表 (57)
- oracle 中文 (51)
- oracle的函数 (57)
- 前端调试 (52)
- 前端登录页面 (48)
本文暂时没有评论,来添加一个吧(●'◡'●)