并发与高并发(二十三)高并发之数据库切库分库分表思路
前言
数据库为什么要切库?如何切库?
主体概要
- 数据库瓶颈
- 数据库切库
- 数据库的分表
主体内容
一、数据库瓶颈
- 单个数据库数据量太大(1-2T):多个库
- 单个数据库服务器压力太大,读写瓶颈:多个库
- 单个表数据量过大:分表
二、数据库切库和分库
现在大型的系统在数据库层面大多采用了读写分离技术,就是一个主库,多个从库。主库主要负责数据更新和实时数据的查询,从库负责的就是非实时数据的查询。因为在实际情况下,数据库大多是读多写少的。而读取数据通常耗时比较长,占用服务器CPU时间也较多,从而影响用户体验。我们通常做法就是将查询从主库中抽取出来,从而多个从库使用负载均衡,减轻每个从库的查询压力。采用“读写分离”的目标就是减轻主库的压力,又可以把用户查询数据的请求分发到不同的从库上,把数据源动态的置入到程序中,让指定的程序选择连接操作主库还是连接从库进行操作。这里用到的技术主要是注解,SpringAOP等等。
主从切库可以参考:https://www.jianshu.com/p/7c3ab519ceed
这里我们说一下“多数据源(切库)”与“分库”的比较区别:
它们都是底层是多个数据库在提供服务。
分库是属于在微服务应用拆分的时候都有自己的数据库,而多数据源是在没有进行应用拆分的时候就已经分成两个库了,根据业务使用不同的代码连接不同的数据库。
分库可参考:http://www.imooc.com/article/25256
https://www.cnblogs.com/shamo89/p/10032390.html
三、数据库的分表
1.什么时候考虑分表?
当一个数据表很大,大到我们做了sql和索引优化之后,基本操作的速度还是影响使用,我们就必须考虑分表了。
2.分表策略
(1)横向分表
将表中不同的数据行按照一定规律分布到不同的数据库表中(这些表保存在同一个数据库中),这样来降低单表数据量,优化查询性能,其中表结构是一样的。
(2)纵向分表
一般根据数据的活跃度进行划分。比如对于博客系统,它对于作者标题之类变化频率慢的数据(冷数据),而博客的访问量,点赞数之类(活跃数据)
(3)mybatis分表插件shardbatis2.0
这个插件的使用我们可以参考https://www.cnblogs.com/shamo89/p/10033349.html