网站首页 > 技术文章 正文
概述
Oracle数据表三种基本类型:堆表Heap Table、索引组织表IOT和聚簇表Cluster。在我们日常中,最常用也是适应性最好的一种数据表就是堆表Heap Table。一般在没有特殊性能缺陷和特性要求的情况下,堆表是我们首先的选项。
IOT是一种融合数据到索引结构上的数据表类型。之前已经详细介绍了IOT的结构、特性和适应场景,同时也对段溢出Segment Overflow、逻辑Rowid和Secondary Index等概念进行过阐述。所以今天主要介绍一下聚簇。
01
聚簇Cluster
三种数据表类型中,我们最不常用的结构应该是聚簇。聚簇也是和其他两种数据表差异最大的一种结构类型,最大的区别在于:聚簇是可以单独存在的。
在Oracle存储结构中,我们必须遵循两个概念就是对象和段Segment。我们可以创建很多对象,比如数据表、索引、视图,但是并不是每个对象都会“真刀真枪”的占用存储空间。Oracle空间分配是依据逻辑表空间、段对象、分区和块。只有数据表、索引等对象,才是可以真正使用空间的,分配Segment的。
堆表和索引组织表虽然有差别,但是本质上是类似的。堆表中,索引和数据表是分别的数据段结构,索引段和数据表段保持一致性。而IOT实现了索引和数据表段的合一。数据表的所有内容,依据主键顺序被保存在IOT索引树的叶子节点上。由于数据表内容的特殊性,比如字段过大的情况,都是通过溢出段实现。
而Cluster完全不同,Cluster是一种单独的段结构,或者可以理解为单独的段空间容器。在没有数据表和索引的时候,Cluster段是可以单独存在的。依据一定的规则,如连接键(Join Key),可以将多个数据表数据保存在同一个段中。并且依据一定场景实现快速检索连接。
为什么使用Cluster数据表?最常见的解释是减少关联检索时候进行IO的数量。传统的数据表结构,两个表连接,至少要进行两次数据块的检索。而Cluster过程,由于都是存储在一起(注意:相同Segment),所以只需一次检索。
Cluster进行使用的时候,有两个类型进行选择,分别为B树Cluster和哈希Hash Cluster。两者既有相同的结构,又有细微的差异。
02
实验环境介绍
这里我选择Oracle 11gR2进行实验。
SQL> select * from v$version;
创建专门的用户进行实验。
SQL> create user test identified by test default tablespace users; SQL> grant resource, connect to test; SQL> grant create cluster to test; SQL> grant select any table to test; SQL> grant select any dictionary to test;
03
B树Cluster实验
Oracle Cluster不是随任何数据表对象创建,而是可以通过SQL语句create cluster来进行创建。
SQL> conn test/test; SQL> create cluster emp_dept(deptno number) size 600; SQL> select cluster_name, tablespace_name, cluster_type, key_size from user_clusters;
注意两个问题,一个是创建cluster的过程中我们指定的size 600。这个是用于指定cluster键大致大小,指定之后,就可以实现空间的预留。如果这个取值设置不合理,容易引起Cluster结构的混乱。
另一个问题是tablespace_name,Cluster对象既然包括了tablespace信息,就必然是占用空间的,也必然以segment的形式出现。
SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name='EMP_DEPT';
注意:此时没有创建数据表或者索引,但是cluster segment已经存在出现。下面根据cluster emp_dept创建数据表。
SQL> create table emp(empno number, empname varchar2(10), deptno number) cluster emp_dept(deptno); SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name='EMP_DEPT'; SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name='EMP';
依托cluster创建数据表的时候,要指定出哪个字段是cluster的key键值。从段结构数据字典中,不能看到数据表的段信息,只有cluster的段信息。从dba_tables中,可以看到数据表成功创建。
SQL> select segment_created from dba_tables where user='TEST' and table_name='EMP';
此时尝试往数据表emp添加数据,是被禁止的。
SQL> insert into emp select empno, ename, deptno from scott.emp;
这里报错是因为使用cluster还需要创建专门的cluster index。为了进行连接测试,先创建第二张数据表,同时创建需要的索引结构。
SQL> create table dept (deptno number primary key, deptname varchar2(10)) cluster emp_dept(deptno); SQL> select OWNER,TABLESPACE_NAME,CLUSTER_NAME,segment_created from dba_tables where user='TEST' and table_name='DEPT'; SQL> create index idx_emp_dept on cluster emp_dept;
查看索引
SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name in ('EMP_DEPT','IDX_EMP_DEPT'); SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name='EMP'; SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name='DEPT'; --Index元数据信息 SQL> select index_type, table_name, table_type, UNIQUENESS from dba_indexes where user='TEST' and index_name='IDX_EMP_DEPT';
我们创建了两张数据表和一个索引,只有cluster和索引成为了段对象。而且两个数据表都包括保存在了cluster段结构中。
创建索引的过程和普通索引是不同的。我们没有给数据表建索引,而是给cluster对象。从dba_indexes视图中,可以看到差异和不同。
下面插入数据。
SQL> insert into dept select deptno, dname from scott.dept; SQL> insert into emp select empno, ename, deptno from scott.emp; SQL> commit;
此时,段结构依然维持一个cluster和一个索引的形态。
SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name='EMP'; SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name='DEPT'; SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name in ('EMP_DEPT','IDX_EMP_DEPT');
使用cluster最大的好处在于连接,我们查看一下连接情况下的执行计划。
SQL> explain plan for select * from emp a, dept b where a.deptno=b.deptno; SQL> select * from table(dbms_xplan.display);
cluster本质上就是一个容器,如果需要删除cluster,需要将其中数据表对象全部删除之后,方可执行。或者使用including tables子句。
SQL> drop cluster emp_dept; SQL> drop cluster emp_dept including tables;
篇幅有限,今天主要分享的是B树聚簇,也是简单的一种聚簇形式。后面再探讨下Hash Cluster的相关内容,感兴趣的朋友可以关注一下~
猜你喜欢
- 2024-10-23 oracle数据库学习笔记 oracle数据库基础教程
- 2024-10-23 珍藏的ORACLE 体系结构详细图——逻辑结构+物理结构
- 2024-10-23 细说Oracle数据库与操作系统存储管理二三事
- 2024-10-23 【赵强老师】Oracle存储过程中的out参数
- 2024-10-23 oracle中怎么创建存储过程 oracle 创建存储过程,及调用
- 2024-10-23 从Oracle的SQL管理能力,看国产数据库差距
- 2024-10-23 Oracle存储过程模板 oracle存储过程视频教程
- 2024-10-23 Oracle学习笔记-存储过程与存储函数
- 2024-10-23 Oracle究竟有没有过时? oracle现在怎么样
- 2024-10-23 Oracle ROWID详解及其妙用 oracle roles
你 发表评论:
欢迎- 549℃Oracle分析函数之Lag和Lead()使用
- 546℃几个Oracle空值处理函数 oracle处理null值的函数
- 542℃Oracle数据库的单、多行函数 oracle执行多个sql语句
- 536℃0497-如何将Kerberos的CDH6.1从Oracle JDK 1.8迁移至OpenJDK 1.8
- 531℃Oracle 12c PDB迁移(一) oracle迁移到oceanbase
- 520℃【数据统计分析】详解Oracle分组函数之CUBE
- 506℃最佳实践 | 提效 47 倍,制造业生产 Oracle 迁移替换
- 496℃Oracle有哪些常见的函数? oracle中常用的函数
- 最近发表
- 标签列表
-
- 前端设计模式 (75)
- 前端性能优化 (51)
- 前端模板 (66)
- 前端跨域 (52)
- 前端缓存 (63)
- 前端react (48)
- 前端aes加密 (58)
- 前端脚手架 (56)
- 前端md5加密 (54)
- 前端富文本编辑器 (47)
- 前端路由 (61)
- 前端数组 (73)
- 前端排序 (47)
- 前端密码加密 (47)
- Oracle RAC (73)
- oracle恢复 (76)
- oracle 删除表 (48)
- oracle 用户名 (74)
- oracle 工具 (55)
- oracle 内存 (50)
- oracle 导出表 (57)
- oracle 中文 (51)
- oracle的函数 (57)
- 前端调试 (52)
- 前端登录页面 (48)
本文暂时没有评论,来添加一个吧(●'◡'●)