网站首页 > 技术文章 正文
业务背景
业务中某个应用在消费MQ的时候,出现部分机器消息堆积,随着时间推移,堆积的机器数量越来越多,消息的堆积总量越来越多。
问题现象
系统监控
CPU、Load、内存、网络、磁盘监控指标正常;JVM 内存、GC正常。
MQ监控
分析过程
MQ消息堆积最常见的情况是:
应用侧处理MQ消息比较慢,触发了MQ的流控机制(MQ在统计到应用消费慢的时候,会逐步减少给应用侧的消息,最糟糕的情况是MQ一条消息也不会发给应用来消费)。
接下来的思路是慢在了哪?
- 在业务监控完备的情况下,通过分析业务监控指标,可以粗略定位异常点
- 明确运行的程序在忙些什么,分析线程堆栈信息
堆栈信息
上面图片中,TID=562的线程正在read Oracle返回的信息。经过观测,TID=562的线程一直处于上面图片中的状态。由于上面图片中的堆栈信息不完整,所以使用jstack抓取后分析出一个关键信息:
locked oracle.jdbc.driver.T4CConnection@31c02e79
T4CConnection分析
【oracle.jdbc.driver.T4CConnection@31c02e79】是与Oracle交互的数据库连接对象,需要分析出
- 该连接对象对应的socket信息
- 该连接对象正在执行的SQL
- 该连接对象关联的statements对象信息
T4CConnection信息
Socket信息
获取到Socket信息进行了如下几个方面的分析:
该Socket与Oracle服务端交互情况:
//通过tcpdump分析与Oracle服务端交互的报文,发现该连接上没有任何报文交互
tcpdump -i any tcp and port 45556 -A -nn
问:与Oracle DBA确认该Socket在服务端正在执行什么SQL?
答:没找到任何关于该Socket的信息
SQL信息
通过分析oracle.jdbc.driver.T4CConnection类代码及【oracle.jdbc.driver.T4CConnection@31c02e79】属性信息找到了正在执行的SQL及与该连接关联的statements信息:
SQL:
statements:
到此,我们分析出了引起线程阻塞的SQL详情。
解决办法
- 对参数是null的情况进行过滤,不再向Oracle发送这样的SQL语句;同时日志里对这种异常情况进行记录,以便更细致地分析数据为null的产生场景。
- 加强应用可观测性之线程执行耗时监控
○ 在业务逻辑开始的前面,添加一个filter
○ 当请求到达filter的时候,将当前线程及此时的时间记录到一个Map中
○ 当请求结束回到filter的时候,将当前线程从Map中删除
○ 单独起一个定时任务来遍历Map,当发现Map中某个线程执行时间超过阈值,就打印出线程的堆栈
○ 当开发人员收到异常堆栈的报警,人工介入进行系统恢复及问题快速定位
猜你喜欢
- 2024-11-11 Docker部署各种服务 docker部署confluence
- 2024-11-11 魔兽世界服务端开服架设服务器搭建教程Centos系统
你 发表评论:
欢迎- 615℃几个Oracle空值处理函数 oracle处理null值的函数
- 608℃Oracle分析函数之Lag和Lead()使用
- 595℃0497-如何将Kerberos的CDH6.1从Oracle JDK 1.8迁移至OpenJDK 1.8
- 592℃Oracle数据库的单、多行函数 oracle执行多个sql语句
- 587℃Oracle 12c PDB迁移(一) oracle迁移到oceanbase
- 580℃【数据统计分析】详解Oracle分组函数之CUBE
- 569℃最佳实践 | 提效 47 倍,制造业生产 Oracle 迁移替换
- 560℃Oracle有哪些常见的函数? oracle中常用的函数
- 最近发表
-
- PageHelper - 最方便的 MyBatis 分页插件
- 面试二:pagehelper是怎么实现分页的,
- MyBatis如何实现分页查询?(mybatis-plus分页查询)
- SpringBoot 各种分页查询方式详解(全网最全)
- 如何在Linux上运行exe文件,怎么用linux运行windows软件
- 快速了解hive(快速了解美国50个州)
- Python 中的 pyodbc 库(pydbclib)
- Linux搭建Weblogic集群(linux weblogic部署项目步骤)
- 「DM专栏」DMDSC共享集群之部署(一)——共享存储配置
- 故障分析 | MySQL 派生表优化(mysql pipe)
- 标签列表
-
- 前端设计模式 (75)
- 前端性能优化 (51)
- 前端模板 (66)
- 前端跨域 (52)
- 前端缓存 (63)
- 前端aes加密 (58)
- 前端脚手架 (56)
- 前端md5加密 (54)
- 前端路由 (61)
- 前端数组 (73)
- 前端js面试题 (50)
- 前端定时器 (59)
- 前端获取当前时间 (50)
- Oracle RAC (76)
- oracle恢复 (77)
- oracle 删除表 (52)
- oracle 用户名 (80)
- oracle 工具 (55)
- oracle 内存 (55)
- oracle 导出表 (62)
- oracle约束 (54)
- oracle 中文 (51)
- oracle链接 (54)
- oracle的函数 (58)
- 前端调试 (52)
本文暂时没有评论,来添加一个吧(●'◡'●)