分布式数据库系统(2)

分布式数据库系统(2)


2024年2月6日发(作者:)

分布式数据库系统(2)

分布式数据库系统(2)

胡经国

六、分布式数据库系统模式结构

根据中国制定的《分布式数据库系统标准》,分布式数据库系统被抽象为四层的模式结构。这种模式结构得到了国内外同行的支持和认同。

分布式数据库系统4层模式结构划分为:全局外层、全局概念层、局部概念层和局部内层;在各层间还有相应的层间映射,层与层(模式与模式)之间是映射关系。这种四层模式结构适用于同构型分布式数据库系统,也适用于异构型分布式数据库系统。

1、全局模式ES(全局外层)

全局模式定义全局用户试图,是分布式数据库的全局用户对分布式数据库最高层抽象。全局用户使用视图时,不必关心数据的分片和具体的物理分配细节。

2、全局概念模式GCS(全局概念层)

全局概念模式定义全局概念视图,是分布式数据库的整体抽象,包含了全局数据特性和逻辑结构。像集中式数据库中的概念模式一样,是对数据库全体的描述。全局概念模式再经过分片模式和分配模式,映射到局部模式。

⑴、分片模式

分片模式是描述全局数据的逻辑化分视图,即全局数据逻辑结构根据某种条件的划分,将全局数据逻辑结构划分为局部数据逻辑结构,每个逻辑划分为一个分片。在关系数据库中,一个关系的一个子关系称为该关系的一个分片。

⑵、分配模式

分配模式是描述局部数据逻辑的局部物理结构,即划分后的分片的物理分配试图。

3、局部概念模式LCS(局部概念层)

局部概念模式定义局部概念视图,是全局概念模式的子集。全局概念模式经逻辑划分后,被分配到各个局部场地上。局部概念模式用于描述局部场地上的局部数据逻辑结构。当全局数据模型与局部数据模型不同时,还涉及数据模型转换等内容。

4、局部内模式LIS(局部内层)

局部内模式定义局部物理视图,是对物理数据库的描述。它类似于集中数据库的内层。

综上所述,分布式数据库的四层结构及模式,定义描述了分布式数据库是一组用网络连接的局部数据库的逻辑集合。它将数据库分为全局数据库和局部数据库。全局数据库到局部数据库,由映射(1:N)模式描述。全局数据库是虚拟的,由全局概念层描述。局部数据库是全局数据库的内层,由局部概念层和局部内层描述。

全局用户只关心全局外层定义的数据库用户视图,其内部数据模型的转换、场地分配细节等由系统自动实现。

分布式数据库划分为全局外层、全局概念层、局部概念层和局部内层。分布式数据库可以描述为虚拟的全局数据库和局部场地数据库的逻辑集合。全局数据库到局部数据库,由分片模式和分配模式映射描述。

分布式数据库系统,借助通信网络完成地理上分布存储的数据的逻辑集中管理。该系统提供给用户的是全局外层视图,就好像集中式数据库一样。全局外层用户的应用请求,分布成局部请求及局部操作,从完成到结果提交及整个全局事务提交,由该系统自动完成。

七、数据分片类型与分片条件

1、分片类型

⑴、水平分片

按一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子集为关系的一个片段。

⑵、垂直分片

把一个全局关系的属性集分成若干子集,并在这些子集上作投影运算,每个投影称为垂直分片。

⑶、导出分片

又称为导出水平分片,即水平分片的条件不是本关系属性的条件,而是其他关系属性的条件。

⑷、混合分片

以上三种方法的混合。可以先水平分片再垂直分片,或先垂直分片再水平分片,或其他形式,但它们的结果是不相同的。

2、分片条件

⑴、完备性条件

必须把全局关系的所有数据映射到片段中,决不允许有属于全局关系的数据却不属于它的某一个片段。

⑵、可重构条件

必须保证能够由同一个全局关系的各个片段来重建该全局关系。对于水平分片可用并操作重构全局关系;对于垂直分片可用联接操作重构全局关系。

⑶、不相交条件

要求一个全局关系被分割后所得的各个数据片段互不重叠(对垂直分片的主键除外)。

八、数据分配方式

1、集中式

所有数据片段都安排在同一个场地上。

2、分割式

所有数据只有一份,它被分割成若干逻辑片段,每个逻辑片段被指派在一个特定的场地上。

3、全复制式

数据在每个场地重复存储。也就是每个场地上都有一个完整的数据副本。

4、混合式

这是一种介乎于分割式和全复制式之间的分配方式。

目前,分布式数据库分配的设计,越来越多地采用寻找最优解的算法,比如遗传算法、退火机制等。

九、分布式数据库系统分类

分布式数据库系统的分类很多。为了全面系统地对分布式数据库系统进行分类,采用分布式数据库的三种特性(分布性、异构性、自治性)组成三维空间图来描述分布式数据库的类型。

1、分布性

分布性是指系统的各组成单元是否位于同一场地上。分布式数据库系统是物理上分散、逻辑上统一的系统,即具有分布性。而集中式数据库系统集中在一个场地上,则不具有分布性。

2、异构性

异构性是指系统的各组成单元是否相同,不同为异构,相同为同构。

异构性主要有:

⑴、数据异构性

数据异构性是指数据在格式上、语法和语义上存在差异。

⑵、数据库系统异构性

数据库系统异构性是指各个场地上的局部数据库系统是否相同。例如,均采用Oracle数据库系统的同构数据库系统。或某些场地采用Sybase数据库系统,某些场地采用Informix数据库系统的异构戏剧库系统。

⑶、平台异构性

平台异构性是指计算机系统是否相同。例如,均为微机系统组成的平台同构系统,或由VAX或ALPHA系统组成的平台异构系统。

3、自治性

自治性是指每个场地的独立自主能力。自治性通常由设计自治性、通信自治性和执行自治性三个方面来描述。

根据自治性,数据库系统可分为集中式系统、联邦式系统(Federated DB)和多库系统(Multi DB)。

⑴、集中式系统

集中式系统即为传统的数据库系统。

⑵、联邦式系统

实现需要交互的所有数据库对之间的一对一连接。

⑶、多库系统

多库系统是指若干相关数据库的集合。各个数据库可以存在同一个场地,也可以分布于多个场地。对多数据库系统进行管理的软件称为多数据库管理系统。多数据库管理系统是对一组自治的数据库进行管理,并提供透明的访问。

十、数据字典信息的组织

1、数据字典简介

数据字典(Data dictionary)是一种用户可以访问的、记录数据库和应用程序元数据的目录。主动数据字典,是指在对数据库或应用程序结构进行修改时,其内容可以由DBMS自动更新的数据字典。被动数据字典,是指修改时必须手工更新其内容的数据字典。

数据字典是指对数据的数据项、数据结构、数据流(数据流是数据结构在系统内传输的路径)、数据存储、处理逻辑、外部实体等进行定义和描述,其目的是对数据流程图中的各个元素做出详细的说明。

数据字典组成:数据项、数据结构、数据流、数据存储、处理过程。

数据字典是数据库的重要组成部分。它存放有数据库所用的有关信息,对用户来说是一组只读的表。

2、数据字典信息的组织

在数据库系统中,采用数据字典存储数据库定义、管理等信息。

在数据库系统中,字典信息分为全局字典和局部字典。字典组织分为集中式字典和分布式字典两种方式。

⑴、集中式字典

集中式字典是指系统中的字典信息集中存储在某个场地存放,进行统一管理。集中式字典维护方便,但是会造成系统性能的瓶颈。

⑵、分布式字典

分布式字典是指将字典信息分布在多个场地上存放,对局部字典是指字典信息不是集中存放在一起的。

分布式字典又分为复制式分布和非复制式分布两种。

复制式分布是指在多个场地上存在字典信息的副本。

非复制式分布是指将字典信息分散存储在多个场地上。

全局字典组织图由类型(局部或全局)、位置(分布或集中)、复制三维立体图描述。

十一、典型应用

以最典型应用的银行领域为例:

1、将分散的数据库从逻辑上联系在一起,可以大大提高数据的管理效率

这就是总行和支行之间的关系:总行与全国各地的支行之间,既有各自需要处理的数据,又有需要交换的数据。

2、将数据分散存储在各地的数据库中,可提高故障发生时的数据安全性

一旦上海支行的数据库出现故障,比如停机、损坏,也是仅仅限于上海支行,总行、广州等其他地区的支行数据库的数据都不会受到影响。

3、分布式架构具备良好的扩展性

例如,在建立一个新的海外支行时,只要将新建的数据库加入到原有的分布式数据库架构中就可以了,以最小的代价在不影响原有支行、总行的情况下完成数据库系统的扩展。

4、以冗余方式进行数据的备份

以备在系统崩溃、数据丢失的情况下,仍有备份数据可以进行恢复。

2017年1月8日编写于重庆

2019年5月1日修改于重庆


发布者:admin,转转请注明出处:http://www.yc00.com/news/1707196671a1483096.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信