网站首页 > 技术文章 正文
LinkSLA与南京大学合作,将AI算法引入运维平台,将趋势性、周期性强的指标数据通过机器学习,实现异常检测、故障预测等功能。
下面分享一个通过AI算法,对Oracle数据库故障预测的案例。
在3月16日,MOC工程师接到某公司的Oracle数据库dbtime运维指标AI检测异常告警。查看告警详情,发现数据库的db time值与历史相同时间段的db time值区别比较大,并且 dbtime一直持续向上的趋势仍在持续。
告警详情页面
进入指标详情页面,查看运行指标,看到数据库运行时间分配给CPU占比低于10%,而等待时间占比高于90%,和以往指标基线有很大的不同。
数据库cpu服务时间
数据库等待时间
一个技术 tips
Oracle数据库中DB Time(请求时间)= DB Wait Time(DB等待时间)+ DB CPU Time(DB CPU服务时间)
等待时间的增加表明数据库负载压力大,资源占用非常严重。MOC工程师继续查看相关运行指标时序图,Active_Serial_Sessions(活动串行会话数)、 Current_logons_count(当前登录数);Current_open_Cursors_Count(当前打开的游标数);SQL_Service_Response_Time SQL(服务响应时间)指标参数均显示异常且持续增长。
如图显示
Active_Serial_Sessions(活动串行会话数)
Current_logons_count(当前登录数)
Current_open_Cursors_Count(当前打开的游标数)
SQL_Service_Response_Time SQL(服务响应时间)
根据AI异常检测告警和相关指标数据时序图分析,这台Oracle数据库负载持续变大,并未任何下降趋势,AI趋势分析,按这个趋势下去,数据库负载将会不断增加,数据库会运行缓慢,最终导致数据库挂死,造成业务中断。
MOC工程师马上将Oracle数据库的AI预警信息,通知用户应用商,检查Oracle数据库运行状态,查找导致dbtime持续增加的原因,将隐患消灭在摇篮里,避免了业务中断现象发生。
案例总结
我们尝试对趋势性、周期性强的指标,进行模型训练,例如我们对oracle的dbtime 等指标进行了模型训练,从实践看还是起到了效果,可以及时发现数据库持续负载压力增大趋势,第一时间通知客户,避免生产事故。后续我们会对监控指标进行分类,不同类型指标按照不同算法进行训练,期望达到更好的效果,提高运维效率。
猜你喜欢
- 2025-07-27 基于X86平台的高性能数据库集群技术的研究
- 2025-07-27 被 NULL 值坑过的必看!用 COALESCE 函数一招搞定所有空值问题
- 2025-07-27 还不理解 Error 和 Exception 吗,看这篇就够了
- 2025-07-27 案例分享| CPU监控异常(cpu实时监控)
- 2025-07-27 PL/SQL基础之异常(运行sql出现异常)
- 2024-10-28 Ask Oracle:狮子座6月5日至11日运势详细分析
- 2024-10-28 oracle的控制文件的隐含参数 oracle查看控制文件路径
- 2024-10-28 Oracle数据库常用undo查询思路 oracle undo
- 2024-10-28 Oracle序列中Cache与NoCache的区别及何时使用
- 2024-10-28 重建MDisk导致上层Oracle数据库不可用的服务器数据恢复案例
你 发表评论:
欢迎- 635℃几个Oracle空值处理函数 oracle处理null值的函数
- 627℃Oracle分析函数之Lag和Lead()使用
- 615℃0497-如何将Kerberos的CDH6.1从Oracle JDK 1.8迁移至OpenJDK 1.8
- 610℃Oracle数据库的单、多行函数 oracle执行多个sql语句
- 607℃Oracle 12c PDB迁移(一) oracle迁移到oceanbase
- 601℃【数据统计分析】详解Oracle分组函数之CUBE
- 589℃最佳实践 | 提效 47 倍,制造业生产 Oracle 迁移替换
- 575℃Oracle有哪些常见的函数? oracle中常用的函数
- 最近发表
-
- CVE-2025-30762|Oracle(java oracle)
- 低代码可能铲不掉“屎山”,但能让这个它更有「型」
- 科技大事件:新苹果手表可通过击掌或握手来传递信息
- 你的百万级上下文窗口大模型,可能并没有你想象中那么强
- DApp 开发中的安全测试(软件测试过程中安全测试的具体应用场景和测试思路)
- 盘点Java中最没用的知识⑧:这3个过时套路,你还在代码里硬撑?
- 机房硬件设备及Oracle数据库软件维护服务项目竞争性磋商公告
- 微软与甲骨文扩大合作关系,推出Oracle Database@Azure
- JPA实体类注解,看这篇就全会了(java实体类注解)
- Java反射机制最全详解(图文全面总结)
- 标签列表
-
- 前端设计模式 (75)
- 前端性能优化 (51)
- 前端模板 (66)
- 前端跨域 (52)
- 前端缓存 (63)
- 前端aes加密 (58)
- 前端脚手架 (56)
- 前端md5加密 (54)
- 前端路由 (61)
- 前端数组 (73)
- 前端js面试题 (50)
- 前端定时器 (59)
- 前端获取当前时间 (50)
- Oracle RAC (76)
- oracle恢复 (77)
- oracle 删除表 (52)
- oracle 用户名 (80)
- oracle 工具 (55)
- oracle 内存 (55)
- oracle 导出表 (62)
- oracle约束 (54)
- oracle 中文 (51)
- oracle链接 (54)
- oracle的函数 (58)
- 前端调试 (52)
本文暂时没有评论,来添加一个吧(●'◡'●)