网站首页 > 技术文章 正文
记录之前的一次非常严重的宕机故障, 当时记得出差南京的路上, 接到客户紧急电话,说是核心系统全部宕机, 数据库无法连接,数据库服务器ssh远程登录很慢,负载很高 ,最高的时候达到了80多。 情况很紧急,只能联系现场的工程师,提供SQL给他们,截图查看了等待事件, 发现有大量 cursor: mutex x等待,解决问题优先,虽然处于高峰期, 还是果断让他们执行了,清空shared pool, 情况有了一定好转, 以下是当时的一个事故分析报告:
以下是数据库基本信息,以及负载情况,负载不算特别高:
以下是数据库Top 10等待事件, 排名第一的是:cursor: mutex x
数据库的基础性能profile, 执行解析比很低
接下来看看数据库的Time Model统计, 时间都消耗在了connection和parse。
主要的SQL执行统计,发现SQL整体都不慢
一个重点发现是SQL的version非常高
问题分析及解决方案
应用系统表现比较慢,sql查询v$session, 发现大量cursor: mutex x, SQL_ID= f0h5rpzmhju11 具体的sql 如下:
select SYS_CONTEXT('USERENV', 'SERVER_HOST'), SYS_CONTEXT('USERENV', 'DB_UNIQUE_NAME'), SYS_CONTEXT('USERENV', 'INSTANCE_NAME'), SYS_CONTEXT('USERENV', 'INSTANCE'), STARTUP_TIME, SYS_CONTEXT('USERENV', 'DB_DOMAIN'), SYS_CONTEXT('USERENV', 'SERVICE_NAME') from v$instance
SQL不是业务上的SQL, 是系统内部查询环境和上下文信息的SQL, 想到有大量的connection managed和mutex的等待,问题很可能和这相关, google上查找了下这个SQL_ID, 发现很多link指向是oracle的bug导致,有一些临时的workaround:
- 先查出sql address, hash_value
select address,hash_value,executions,parse_calls from v$sql where sql_TEXT like '%SYS_CONTEXT%';
- 调用存储过程purge掉此SQL在share pool latch信息
call sys.dbms_shared_pool.purge('address,hash_value','c');
- 也可以直接flush 整个share pool,但会对数据库整体性能有影响,不建议高峰期执行。
alter system flush shared_pool;
- 直接修改隐藏参数,建议在有DBA支持的情况进行,毕竟隐藏参数oracle官方不推荐。
alter system set "_cursor_obsolete_threshold"=1024
关于 cursor: mutex x
关于等待事件cursor: mutex x,原因有很多种,具体的分析,下次统一写一个文档。
参考信息
NOTE:438755.1 - High SQL Version Counts - Script to determine reason(s)
High Version Count with CURSOR_SHARING = SIMILAR or FORCE (Doc ID 261020.1)
Troubleshooting: High Version Count Issues (Doc ID 296377.1)
Patch 25054064: TST&PERF:EBS: VERY HIGH VERSION COUNT AND CURSOR MUTEX WAITS AFTER PLUG INTO CDB
猜你喜欢
- 2024-10-24 oracle数据库学习,发展方向有哪些?
- 2024-10-24 选择XTREMIO提高ORACLE DBA工作效率
- 2024-10-24 DBA日记之Oracle位图索引引发的灾难
- 2024-10-24 ORACLE DBA TOP SQL查询 oracle查询dba用户
- 2024-10-24 DBA日记之Oracle数据库索引一 oracle数据库索引怎么看?
- 2024-10-24 2018年 oracle自治数据库云 DBA工作三大重点!
- 2024-10-24 互动送书-《Oracle DBA工作笔记》签名版
- 2024-10-24 Oracle DBA做SQL优化的最佳思路 基于oracle的sql优化如何
- 2024-10-24 DBA常用sql之Oracle 《oracle dba入门》
- 2024-10-24 DBA必备知识|Oracle 托管文件 (OMF)详解
你 发表评论:
欢迎- 620℃几个Oracle空值处理函数 oracle处理null值的函数
- 612℃Oracle分析函数之Lag和Lead()使用
- 601℃0497-如何将Kerberos的CDH6.1从Oracle JDK 1.8迁移至OpenJDK 1.8
- 597℃Oracle数据库的单、多行函数 oracle执行多个sql语句
- 593℃Oracle 12c PDB迁移(一) oracle迁移到oceanbase
- 584℃【数据统计分析】详解Oracle分组函数之CUBE
- 574℃最佳实践 | 提效 47 倍,制造业生产 Oracle 迁移替换
- 563℃Oracle有哪些常见的函数? oracle中常用的函数
- 最近发表
- 标签列表
-
- 前端设计模式 (75)
- 前端性能优化 (51)
- 前端模板 (66)
- 前端跨域 (52)
- 前端缓存 (63)
- 前端aes加密 (58)
- 前端脚手架 (56)
- 前端md5加密 (54)
- 前端路由 (61)
- 前端数组 (73)
- 前端js面试题 (50)
- 前端定时器 (59)
- 前端获取当前时间 (50)
- Oracle RAC (76)
- oracle恢复 (77)
- oracle 删除表 (52)
- oracle 用户名 (80)
- oracle 工具 (55)
- oracle 内存 (55)
- oracle 导出表 (62)
- oracle约束 (54)
- oracle 中文 (51)
- oracle链接 (54)
- oracle的函数 (58)
- 前端调试 (52)
本文暂时没有评论,来添加一个吧(●'◡'●)