CAP理论
理解CAP
不能因为有一点网络问题就导致整个系统无法提供服务,网络因素成为了分布式事务的考量标准之一。
CAP是Consistency、Availability、Parttion tolerance 三个词语的缩写,分别表示一致性、可用性、分区容忍性。
C - Consistency
一致性是指写操作后的读操作可以读取到最新的数据状态,当数据分布在多个节点上,从任意节点读取到的数据都是最新的状态。
如何实现一致性?
- 写入主数据库后要将数据同步到从数据库。
- 写入主数据库后,在向从数据库同步期间要将从数据库锁定,待同步完成后再释放锁,以免在新数据写入成功后,向从数据库查询到旧的数据。
分布式系统一致性的特点:
- 由于存在数据同步的过程,写操作的响应会有一定的延迟。
- 为了保证数据一致性会对资源暂时锁定,待数据同步完成释放锁定资源。
- 如果请求数据同步失败的节点则会返回错误信息,一定不会返回旧数据。
A - Availablility
可用性是指任何事务操作都可以得到响应结果,且不会出现响应超时或响应错误。
如何实现可用性?
- 写入主数据库后要将数据同步到从数据库。
- 由于要保证从数据库的可用性,不可将从数据库中的资源进行锁定。
- 即使数据还没有同步过来,从数据库也要返回查询到的数据,哪怕是旧数据,如果连旧数据也没有则可以按照约定返回一个默认信息,但不能返回错误或响应超时。
分布式系统可用性的特点:
- 所有请求都有响应,且不会出现响应超时或响应错误。
P - Partition tolerance
通常分布式系统的各个节点部署在不同的子网,这就是网络分区,不可避免的会出现由于网络问题而导致节点之间通信失败,此时仍可对外提供服务,这叫分区容忍性。
如何实现分区容忍性?
- 尽量使用异步取代同步操作,例如使用异步方式将数据从主数据库同步到从数据库,这样节点之间能有效的实现松耦合。
- 添加从数据库节点,其中一个从节点挂掉,其它从节点提供服务。
分布式系统分区容忍性特点:
- 分区容忍性是分布式系统具备的基本能力。
CAP组合方式
在所有分布式事务场景中不会同时具备CAP三个特性,因为在具备了P的前提下C和A是不能共存的。
本图分区容忍的含义是:
- 主数据库通过网络向从数据库同步数据,可以认为主从数据库部署在不同的分区,通过网络进行交互。
- 当主数据库和从数据库之间的网络出现问题不影响主数据库和从数据库对外提供服务。
- 其一个节点挂掉不影响另一个节点对外提供服务。
如果要实现C则必须保证数据一致性,在数据同步的时候为防止从数据库查询不一致的数据则需要将从数据库数据锁定,待同步完成后解锁,如果同步失败从数据库要返回错误信息或超时信息。
如果要实现A则必须保证数据可用性,不管任何时候都可以向从数据库查询数据即不会响应超时或返回错误信息。
通过分析发现在满足P的前提下C和A存在矛盾性。
组合方式:
-
AP :
放弃一致性,追求分区容忍性和可用性。这是很多分布式系统设计时的选择。
例如:上边的商品管理,完全可以实现AP,前提是只要用户可以接受所查询到的数据在一定时间内不是最新的即可。
通常实现AP都会保证最终一致性,BASE理论就是根据AP扩展来的,有一些业务场景比如“订单退款,今日退款成功,明日账户到账,只要用户可以接受在一定时间内到账即可。
-
CP:
放弃可用性,追求一致性和分区容错性,zookeeper其实就是追求的强一致,又比如跨行转账,一次转账请求要等待对方银行系统都完成整个事务才算完成。
-
CA:
放弃分区容忍性,即不进行分区,不考虑由于网络不通或节点挂掉的问题,则可以实现一致性和可用性。那么系统将不是一个标准的分布式系统,我们最常用的关系型数据就满足了CA。
主数据库和从数据库中间不再进行数据同步,数据库可以响应每次的查询请求,通过事务隔离级别实现每个查询请求都可以返回最新的数据。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!