网站首页 > 技术文章 正文
废话不多说,直接干货。
一、oracle去重
1、创建测试数据
create table test_duplicate_removal(
c001 number,
c002 varchar2(100)
);
insert into test_duplicate_removal values(101, 'aa');
insert into test_duplicate_removal values(102, 'aa');
insert into test_duplicate_removal values(103, 'aa');
insert into test_duplicate_removal values(104, 'bb');
insert into test_duplicate_removal values(105, 'bb');
insert into test_duplicate_removal values(106, 'cc');
insert into test_duplicate_removal values(107, 'cc');
insert into test_duplicate_removal values(108, 'dd');
2、使用row_number() over()函数根据C002列去重
创建一个rn列,根据C002进行分组,每个小组内再根据C001的值进行排序。
select c001,c002, row_number() over(partition by c002 order by c001 desc) rn from test_duplicate_removal
通过rn筛选值为1的行,同时也就对C002进行了去重
select * from (select c001,c002, row_number() over(partition by c002 order by c001 desc) rn from test_duplicate_removal) t where t.rn=1
二、python的pandas模块去重方法
1、将数据库数据导出保存为CSV
2、pandas实现sql里排序函数row_number() over()功能
import pandas as pd
# 读取CSV数据
df = pd.read_csv('test_duplicate_removal.csv')
print('打印原始数据:')
print(df)
# 此处等价于sql里的排序函数row_number() over()功能
df['RN'] = df['C001'].groupby(df['C002']).rank()
print()
print('根据C002分组,根据C001组内排序:')
print(df)
# 去重
print()
print('去重,筛选RN=1的行:')
print(df[df['RN'] == 1])
运行结果
猜你喜欢
- 2025-08-05 Java对象相等的秘密:不遵守equals/hashCode契约,bug找上门!
- 2025-08-05 Oracle优化器三大核心:查询从写法到执行计划,是如何炼成的?
- 2024-11-01 oracle维护手册(一) oracle系统维护
- 2024-11-01 Oracle 告警日志过大处理过程 oracle异常关闭日志
- 2024-11-01 oracle已有表的分表分区优化操作步骤(单表过大)
- 2024-11-01 【Oracle】准实时大规模数据提取 oracle实时数据采集
- 2024-11-01 Oracle 中 drop_column 的几种方式和风险
- 2024-11-01 Oracle压缩黑科技(一)—基础表压缩
- 2024-11-01 Oracle 表分区在线重定义 oracle分区表重命名rename
- 2024-11-01 MySQL 去重的简单介绍 3 种方法?,还有谁不会?
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- 前端设计模式 (75)
- 前端性能优化 (51)
- 前端模板 (66)
- 前端跨域 (52)
- 前端缓存 (63)
- 前端aes加密 (58)
- 前端脚手架 (56)
- 前端md5加密 (54)
- 前端路由 (61)
- 前端数组 (73)
- 前端js面试题 (50)
- 前端定时器 (59)
- Oracle RAC (76)
- oracle恢复 (77)
- oracle 删除表 (52)
- oracle 用户名 (80)
- oracle 工具 (55)
- oracle 内存 (55)
- oracle 导出表 (62)
- oracle约束 (54)
- oracle 中文 (51)
- oracle链接 (54)
- oracle的函数 (58)
- oracle面试 (55)
- 前端调试 (52)
本文暂时没有评论,来添加一个吧(●'◡'●)