​分布式数据库技术基础:数据分布介绍

 

 

1、数据分布的定义

数据分布是指在分布式环境中通过合理分布数据,提高数据操作自然并行度,以达到最优的执行效率的目的。在构建分布式数据库系统运行环境时,必须考虑数据如何分布在系统的各个场地上。

数据分布主要关注的问题是在分布式数据中,如何合理的放置数据,从而使得相关数据之间的相对位置最合适。

2、数据分布的内容

数据分布的内容主要有数据位置存放问题、高效的数据划分问题两个方面。

数据位置存放问题:主要是研究如何把已经划分好的数据合理放置在网络上,以获得最优的执行效率,从而减少网络传输的数据量。

高效的数据划分问题:如何把数据合理的划分开,使得使用率最高的数据能被放置在性能最好的节点上。

3、数据分布的策略

3.1 集中式

所有的全局数据片都安排一个节点上。

优点:因为数据都存放在一个节点上,对数据的控制管理比较容易、数据的一致性、完整性能够得到保证。

缺点:节点负担太重,容易出现性能瓶颈、节点依赖性太强,如果该节点出现故障,将使整个系统崩溃、可靠性相对较差。对节点设备要求会很高。

3.2 分割式 

所有全局数据有且只有一份,它们被分割出若干个逻辑片段,每个逻辑片段被分别指派在特定的节点上,对全局数据进行了划分。

优点:数据存储量大、存放在各个节点可以自治检索和修改数据、因为数据是分布在多个节点上的,如果部分节点出现故障,系统仍然可以运行、可靠性较好。

缺点:针对全局修改、查询等操作需要时间会比集中式长一些,因为数据在不同节点需要进行网络通信。

3.3 复制式 

全局数据有多个副本,每个站点上都有完整的数据副本。

优点:系统可靠性较高、响应速度快、数据恢复很容易。

缺点:保持各个节点的同步修改操作要付出高昂的代价、数据冗余很大。

3.4 混合式

全局数据被划分为若干个数据子集,每个子集被放在不同的节点上,但任何一个节点上都没有保持全部的数据,根据数据的重要性决定各个数据子集副本的数量。

优点:兼顾了分割式和复制式的优点、灵活性好、可以提高系统的效率。

缺点:包括了分割式和复制式的复杂性。

IT技术分享社区

个人博客网站:https://programmerblog.xyz

文章推荐程序员效率:画流程图常用的工具程序员效率:整理常用的在线笔记软件远程办公:常用的远程协助软件,你都知道吗?51单片机程序下载、ISP及串口基础知识硬件:断路器、接触器、继电器基础知识

posted @ 2021-01-19 07:36  天使不哭  阅读(6)  评论(0编辑  收藏  举报  来源