分布式数据库技术基础:数据分布介绍
1、数据分布的定义
数据分布是指在分布式环境中通过合理分布数据,提高数据操作自然并行度,以达到最优的执行效率的目的。在构建分布式数据库系统运行环境时,必须考虑数据如何分布在系统的各个场地上。
数据分布主要关注的问题是在分布式数据中,如何合理的放置数据,从而使得相关数据之间的相对位置最合适。
2、数据分布的内容
数据分布的内容主要有数据位置存放问题、高效的数据划分问题两个方面。
数据位置存放问题:主要是研究如何把已经划分好的数据合理放置在网络上,以获得最优的执行效率,从而减少网络传输的数据量。
高效的数据划分问题:如何把数据合理的划分开,使得使用率最高的数据能被放置在性能最好的节点上。
3、数据分布的策略
3.1 集中式
所有的全局数据片都安排一个节点上。
优点:因为数据都存放在一个节点上,对数据的控制管理比较容易、数据的一致性、完整性能够得到保证。
缺点:节点负担太重,容易出现性能瓶颈、节点依赖性太强,如果该节点出现故障,将使整个系统崩溃、可靠性相对较差。对节点设备要求会很高。
3.2 分割式
所有全局数据有且只有一份,它们被分割出若干个逻辑片段,每个逻辑片段被分别指派在特定的节点上,对全局数据进行了划分。
优点:数据存储量大、存放在各个节点可以自治检索和修改数据、因为数据是分布在多个节点上的,如果部分节点出现故障,系统仍然可以运行、可靠性较好。
缺点:针对全局修改、查询等操作需要时间会比集中式长一些,因为数据在不同节点需要进行网络通信。
3.3 复制式
全局数据有多个副本,每个站点上都有完整的数据副本。
优点:系统可靠性较高、响应速度快、数据恢复很容易。
缺点:保持各个节点的同步修改操作要付出高昂的代价、数据冗余很大。
3.4 混合式
全局数据被划分为若干个数据子集,每个子集被放在不同的节点上,但任何一个节点上都没有保持全部的数据,根据数据的重要性决定各个数据子集副本的数量。
优点:兼顾了分割式和复制式的优点、灵活性好、可以提高系统的效率。
缺点:包括了分割式和复制式的复杂性。
IT技术分享社区
个人博客网站:https://programmerblog.xyz
文章推荐程序员效率:画流程图常用的工具程序员效率:整理常用的在线笔记软件远程办公:常用的远程协助软件,你都知道吗?51单片机程序下载、ISP及串口基础知识硬件:断路器、接触器、继电器基础知识
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
2020-01-19 C#利用SQLDMO备份与还原数据库
2019-01-19 10个顶级的CSS3代码生成器
2019-01-19 10个顶级的CSS3代码生成器
2018-01-19 【收集】47种常见的浏览器兼容性问题
2018-01-19 【收集】47种常见的浏览器兼容性问题
2018-01-19 【收集】47种常见的浏览器兼容性问题