随笔 - 832  文章 - 2  评论 - 31  阅读 - 167万

分库分表理论概述

1.什么是分库分表

一个库一个表 拆分为 N个库N个表
分为垂直拆分,水平拆分

2.为什么要分库分表

随着业务发展,表的数量,以及单表数据量越来越大,而由于无法分布式部署(部分数据库支持),单台服务器资源(cpu 内存,IO)的限制,导致数据操作开销大,查询慢,因此需要进行分库分表,提高数据查询速度。
常见优化策略:
更换数据库(缓存)
SQL 索引 字段 优化
分区
读写分离
分库分表

3.读写分离

master-slave模式,mastr负责更新操作,slave负责查询操作。

4.分库分表常见方式

垂直拆分:

根据字段拆分

垂直分库:

按照业务划分,将不同业务数据单独拆分成一个库。“微服务治理”做法类似,每个微服务单独使用一个库。


垂直分库
垂直分表

如果单表字段过多,可以通过"大表拆小表"方式将不常用或者字段长度较大的表
拆分到扩展表中,mysql是按照数据页进行存储的,如果单行数据过大,会导致数据跨页,造成额外的性能开销。


垂直分表
垂直拆分优点:
  • 业务系统解耦。
  • 与微服务治理类似,便于集中管理,监控,扩展
  • 高并发情况下提升IO,数据库连接数,单机硬件资源瓶颈
垂直拆分缺点:
  • 多表join只能通过应用程序解决,加大开发复杂度
  • 分布式事务处理复杂
  • 单表数据总量无法解决(水平切分处理)
水平拆分

将一个表中的数据以某一个字段(取模),拆分到多个表中(根据内容拆分

水平拆分
水平拆分的优点:
  • 使单表的数量保持在一定数量,提高查询性能
  • 切分后表结构相同,程序改动小
水平拆分的缺点:
  • 数据扩容
  • 分片规则难以抽象(不同的库,难以固定某个字段拆分,比如商品可以商品IDhash到某个库中,订单表需要根据用户IDhash到某个库中)
  • 分布式事务,部分业务无法关联join

5.分库分表带来的问题

  • 分布式事务
  • 表join
    -分布式全局唯一Id(twitter开源的 snowFlake)

6.分库分表算法

取模

通过 某一个字段进行hash userId%3 =1 则分配到1库。可以使数据均匀分布,避免数据热点问题。数据扩容是明显的缺点,可以采用 一致性hash 算法

范围

比如按月 按省分配

预定义

1亿数据 每个库存100万数据,可以预先创建10个库。

7.常用的中间件

分为两种类型:
Proxy代理:
mycat(重)、mysql-proxy atlas、sharding-proxy(sharding-sphere )

Proxy代理

jdbc直连:
TDDL(淘宝 半开源) 、sharding-jdbc(sharding-sphere )

jdbc直连


作者:3517a85fd522
链接:https://www.jianshu.com/p/658bc9151e7b
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
posted on   小破孩楼主  阅读(216)  评论(0编辑  收藏  举报
编辑推荐:
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示