分布式数据库查询优化技术摘要在分布式数据库中,由于高可靠性和高速度性是其重要特点,所以对查询执行的要求也就更高
而查询执行中查询优化是执行的关键环节,查询优化在很大程度上决定查询的效率或快慢
本文讨论的重点是对分布式查询执行的全局处理策略进行优化,尽可能避免通信代价的开销,并着眼于查询执行的实际代价,从分布式系统中选出一个最优的执行节点
从查询执行的效果出发,通过统计的方式,不断从最近的查询执行代价学习纠正最近查询执行的统计代价,为查询的全局处理提供参考,以达到优化执行、提高执行效率和速度的目的
1分布式数据库概述1
1分布式数据库的定义所谓分布式数据库系统就是由分布于多个计算机结点上的若干个数据库组成,每个子数据库系统都是一个独立的数据库系统,它们都拥有各自的数据库、中央处理机、终端,以及各自的局部数据库管理系统,分布式数据库在使用上可视为一个完整的数据库,而实际上它是分布在地理分散的各个结点上
当然,分布在各个结点上的子数据库在逻辑上是相关的
简单的说,分布式数据库系统是一系列集中式数据库系统的联合
它们在逻辑上属于同一系统,但在物理结构上是分布式的[1]
2分布式数据库系统的组成如图1-1所示,分布式数据库系统由以下述成分组成:(1)多台计算机设备,并由计算机网络连接
(2)计算机网络设备,网络通讯的一组软件
(3)分布式数据库管理系统,它包括GDBMS、LDBMS、CM,除了具有全局用户接口由GDBMS连接外,还可以具有自治场地用户接口,由场地DBMS链接,并持有独立的场地目录
(4)分布式数据库管理者(DDB),包括全局数据库(GDB)和局部数据库(LDB)以及自制场地的自治场地数据库
(5)分布式数据库管理者(DDBA),它可分为二级,一级为全局数据库管理者(GDBA),另一级问局部或自治场地数据库管理者,统称为局部数据库管理者(LDBA)
(6)分布式数据