为什么会决定进行分库分表,分库分表过程中遇到什么难题,如何解决的?
一、为什么决定进行分库分表?
-
根据业务类型,和业务容量的评估,来选择和判断是否使用分库分表
-
当前数据库本事具有的能力,压力的评估
-
数据库的物理隔离,例如减少锁的争用、资源的消耗和隔离等
-
热点表较多,并且数据量大,可能会导致锁争抢,性能下降
-
数据库的高并发,数据库的读写压力过大,可能会导致数据库或系统宕机
-
数据库(MySQL5.7以下)连接数过高,会增加系统压力
-
单表数据量大,如SQL使用不当,会导致io随机读写比例高。查询慢(大表上的B+树太大,扫描太慢,甚至可能需要4层B+树)
-
备份和恢复时间比较长
二、都遇到什么问题?
-
全局pk(主键和唯一索引)的冲突检测不准确,全局的自增主键支持不够好
-
分片键的选择。如没有选择好,可能会影响SQL执行效率
-
分布式事务,中间价产品对分布式事务的支持力度
-
对于开发来说,需要进行业务的拆分
-
对于开发来说,部分SQL不兼容则需要代码重构,工作量的评估
-
对于开发来说,跨库join,跨库查询
三、如何解决?
-
使用全局分号器。或者使用全局唯一id,(应用生成顺序唯一int类型做为全局主键)
-
应用层来判断唯一索引
-
配合应用选择合适的分片键,并加上索引
-
配合应用,配合开发,对不兼容SQL的进行整改