关系型数据库分库

1. 数据库分库是什么?

从字面上简单理解,就是把原本存储于一个库的数据分块存储到多个库上。

数据库分布式核心内容无非是数据切分,以及切分后对数据的定位,整合。数据切分就是将数据分散存储到多个数据库中,使得单一数据库中的数据量变小,通过扩充主机的数量缓解单一数据库的性能问题,从而达到提升数据库操作性能的目的。

2. 为什么要进行数据库分库

关系型数据库本身比较容易成为系统瓶颈,单机存储容量,连接数,处理能力都有限。当单标数据量达到1000W或者100G以后,由于查询维度较多,机试添加从库,优化索引,做很多操作时性能扔下降严重。此时就要考虑对其进行切分了,切分的目的就在于减少数据库的负担,缩短查询时间。所以分库分表就是为了解决由于数据量过大而导致数据库性能降低问题,将原来独立的数据库拆分成若干数据库组成,将数据大表拆分成若干数据表组成,使得单一数据库,单一数据表的数据量变小,从而达到提升数据库性能的目的。

3. 解决方案

  3.1 方案一:

    通过提升服务器硬件能力来提高数据处理能力,比如增加存储容量,CPU等,这种方案成本很高,并且如果瓶颈在MySQL本身,那么提高硬件也是有限的。

3.2 方案二

    把数据分散在不同的数据库中,使得单一数据库的数据量变小来缓解单一数据库的性能问题,从而达到提升数据库性能的目的,如下图:将电商数据拆分为若干独立的数据库,并且对于大表也拆分为若干小表,通过这种数据库拆分的方法来解决数据库的性能问题。

3.2.1 垂直切分

  垂直分表 : 将一个表按照字段分成多表,每个表存储其中一部分字段。 脑瓜子嗡嗡的吧,看图片会理解一点。

  

  好处:为了避免IO争抢并减少锁表的几率,查看详情的用户与商品信息浏览互不影响。

     充分发挥热门数据的操作效率,商品信息的操作的高效率不会被商品描述的低效率所拖累。

 

垂直分库就是根据业务耦合性,将关联度低的不同表存储在不同的数据库。做法与大系统拆分为过个小系统类似,按业务分类进行独立划分。与微服务治理的做法相似,每个微服务使用单独一个数据库。它的核心理念是转库专用。

 

 

垂直切分的好处:

    • 解决业务系统层面的耦合,业务清晰
    • 与微服务的治理类似,也能对不同业务的数据进行分级管理,维护,监控,扩展等。
    • 高并发场景下,垂直切分一定程度的提升IO,数据库连接数,单机硬件资源的瓶颈。

垂直切分的缺点:

  • 部分表无法join,只能通过接口聚合方式解决,提升了开发的复杂度。
  • 分布式事务处理复杂
  • 依然存在单表数据量过大的问题。

3.2.2 水平切分

当一个应用难以再细粒度的垂直切分,或切分后数据量行数巨大,存在单库读写,存储性能瓶颈,这时候就需要进行水平切分了,

水平切分分为库内分表和分库分表,是根据表内数据内在的逻辑关系,将同一个表按不同的条件分散到多个数据库或多个表中,每个表中只包含一部分数据,从而使得单个表的数据量变小,达到分布式的效果。

库内分表只解决了单一表数据量过大的问题,但没有将表分布到不同的机器的库上,因此对于减轻MySQL数据库的压力来说,帮助不是很大,大家还是竞同一个物理机的CPU,内存,网络,最好通过分库分表来解决。

水平分库

  将店铺id为单数和店铺id为双数的商品信息分别放在两个库中。 水平分库是把同一个表的数据按一定规则拆到不同的数据库中,每个库可以放在不同的服务器上。

  

 

   水平分表:

    与水平分库的思路类似,不过这次操作的目标是表,商品信息及商品描述被分成了两套表。

 

 

水平切分的好处:

    • 不存在单库数据量过大,高并发的性能瓶颈,提升系统稳定性和负载能力
    • 应用端改造较小,不需要拆分业务模块

水平切分的缺点:

    • 跨分片的事务一致性难以保证
    • 跨库的join关联查询性能较差
    • 数据多次扩展难度和维护量较大

垂直分库和水平分库的区别

      垂直分库是按照业务不同,把不同的表分到不同的数据库中

      水平分库是把同一个表的数据按一定规则拆到不同的数据库中,每个库可以放在不同的服务器上。把数据分到不同的数据库

最重要的来了

一般来说,在系统设计阶段就应该根据业务耦合松紧来确定垂直分库,垂直分表方案,在数据量及访问压力不是特别大的情况下,首先考虑缓存,读写分离,索引技术等方案。若数据量极大,切持续增长,在考虑水平分库水平分表。

 

posted @ 2021-02-01 21:03  恰恰的故事  阅读(132)  评论(0编辑  收藏  举报