数据库高并发

问题描述

  • 在多用户环境中,在同一时间可能会有多个用户更新相同的记录,这会产生冲突,具体为:
  • 丢失更新:一个事务的更新覆盖了其它事务的更新结果,就是所谓的更新丢失。例如:用户A把值从6改为2,用户B把值从2改为6,则用户A丢失了他的更新;
  • 脏读:当一个事务读取其它完成一半事务的记录时,就会发生脏读取。例如:用户A,B看到的值都是6,用户B把值改为2,用户A读到的值仍为6;

数据库层面的并发控制-悲观锁

  • 说明:
  • 假定本次读写一定会发生并发冲突,屏蔽一切可能违反数据完整性的操作;
  • 适用于实际业务中冲突发生可能性较大的情况,比如很有可能不同的人同时修改同一条数据库记录;
  • 如果实际业务中冲突发生可能性较小,则用悲观锁效率很低(因为上锁的代价大);
  • 使用:
  • 操作之前先上锁;
  • 需要使用数据库的锁机制,比如SQL SERVER 的TABLOCKX(排它表锁) 此选项被选中时,SQL Server将在整个表上置排它锁直至该命令或事务结束,这将防止其他进程读取或修改表中的数据;

数据库层面的并发控制-乐观锁

  • 说明:
  • 假设不会发生并发冲突,只在提交操作时检查是否违反数据完整性,乐观锁不能解决脏读的问题;
  • 适用于实际业务中冲突发生可能性较小的情况,比如几乎不可能不同的人同时修改同一条数据库记录;
  • 使用:
  • 数据表中专门有一个version字段(int型)记录版本信息;
  • 每当这条记录改动时,这条记录对应的version字段增1;
  • 每次更新时检查版本号是否一致,比如数据库中数据版本为6,更新提交时version=6+1,使用该version值(=7)与数据库version+1(=7)作比较,如果相等,则可以更新,如果不等则有可能其他程序已更新该记录,所以返回错误;

常见并发同步案例分析

案例一:订票系统案例

某航班只有一张机票,假定有1w个人打开你的网站来订票,问你如何解决并发问题(可扩展到任何高并发网站要考虑的并发读写问题)。问题:1w个人来访问,票没出去前要保证大家都能看到有票,不可能一个人在看到票的时候别人就不能看了。到底谁能抢到,那得看这个人的“运气”(网络快慢等),其次考虑的问题“并发”:1w个人同时点击购买,到底谁能成交?总共只有一张票。

首先我们容易想到和并发相关的几个方案 :

  • 锁同步同步更多指的是应用程序的层面,多个线程进来,只能一个一个的访问,java中指的是syncrinized关键字。锁也有2个层面,一个是java中谈到的对象锁,用于线程同步;另外一个层面是数据库的锁;如果是分布式的系统,显然只能利用数据库端的锁来实现。
  • 假定我们采用了同步机制或者数据库物理锁机制,如何保证1w个人还能同时看到有票,显然会牺牲性能,在高并发网站中是不可取的。使用hibernate后我们提出了另外一个概念:乐观锁、悲观锁(即传统的物理锁);
  • 采用乐观锁即可解决此问题。乐观锁意思是不锁定表的情况下,利用业务的控制来解决并发问题,这样即保证数据的并发可读性又保证保存数据的排他性,保证性能的同时解决了并发带来的脏数据问题。

hibernate中如何实现乐观锁:
前提:在现有表当中增加一个冗余字段,version版本号, long类型
原理:

  • 只有当前版本号 >= 数据库表版本号才能提交
  • 提交成功后,版本号version ++

案例一:股票交易系统、银行系统

首先,股票交易系统的行情表,每几秒钟就有一个行情记录产生,一天下来就有(假定行情3秒一个) 股票数量×20×60*6条记录,一月下来这个表记录数量多大? oracle中一张表的记录数超过100w后查询性能就很差了,如何保证系统性能?再比如,中国移动有上亿的用户量,表如何设计?把所有用于存在于一个表么?

所以大数量的系统,必须考虑表拆分-(表名字不一样,但是结构完全一样),通用的几种方式:(视情况而定)

  • 按业务分,比如 手机号的表,我们可以考虑 130开头的作为一个表,131开头的另外一张表 以此类推
  • 利用oracle的表拆分机制做分表
  • 如果是交易系统,我们可以考虑按时间轴拆分,当日数据一个表,历史数据弄到其它表。这里历史数据的报表和查询不会影响当日交易。

此外,我们还得考虑缓存,这里的缓存,指的不仅仅是hibernate,hibernate本身提供了一级二级缓存。这里的缓存独立于应用,依然是内存的读取,假如我们能减少数据库频繁的访问,那对系统肯定大大有利的。比如一个电子商务系统的商品搜索,如果某个关键字的商品经常被搜,那就可以考虑这部分商品列表存放到缓存(内存中去),这样不用每次访问数据库,性能大大增加。简单的缓存大家可以理解为自己做一个hashmap,把常访问的数据做一个key,value是第一次从数据库搜索出来的值,下次访问就可以从map里读取,而不读数据库;专业些的目前有独立的缓存框架比如memcached 等,可独立部署成一个缓存服务器。

常见的提高高并发下访问的效率的手段

首先要了解高并发的的瓶颈在哪里?

  1. 可能是服务器网络带宽不够
  2. 可能web线程连接数不够
  3. 可能数据库连接查询上不去。

根据不同的情况,解决思路也不同。

  1. 像第一种情况可以增加网络带宽,DNS域名解析分发多台服务器。
  2. 负载均衡,前置代理服务器nginx、apache等等
  3. 数据库查询优化,读写分离,分表等等

最后复制一些在高并发下面需要常常需要处理的内容:

  • 尽量使用缓存,包括用户缓存,信息缓存等,多花点内存来做缓存,可以大量减少与数据库的交互,提高性能。
  • 用jprofiler等工具找出性能瓶颈,减少额外的开销。
  • 优化数据库查询语句,减少直接使用hibernate等工具的直接生成语句(仅耗时较长的查询做优化)。
  • 优化数据库结构,多做索引,提高查询效率。
  • 统计的功能尽量做缓存,或按每天一统计或定时统计相关报表,避免需要时进行统计的功能。
  • 能使用静态页面的地方尽量使用,减少容器的解析(尽量将动态内容生成静态html来显示)。

解决以上问题后,使用服务器集群来解决单台的瓶颈问题。

结论

  • 在实际生产环境里边,如果并发量不大且不允许脏读,可以使用悲观锁解决并发问题;
  • 但如果系统的并发非常大的话,悲观锁定会带来非常大的性能问题,所以我们就要选择乐观锁定的方法;
  • 上面介绍的锁都是数据库层面的锁,其实,如果从业务层面来看,上面的并发控制机制还是不够的,在数据库设计时,可以设计lock字段,如果要暂时锁定某些行,令lock=1时视为锁定,业务锁面向业务,更加可靠;

参考文档

数据库并发冲突的解决

posted @ 2017-10-14 12:01  银魔术师  阅读(472)  评论(0编辑  收藏  举报