一次有趣的Debug——使用Lumigent Log Explorer对SQL Server事务日志进行分析,对SQL Server事务、操作进行撤销(恢复)
前言
本文通过一个Bug的分析、解决,概述了使用Lumigent Log Explorer对SQL Server的事务日志进行分析的方法,以及常见的数据库误操作后的恢复、撤销方法
Bug描述
网站的文章模块有一个评分的功能:
- 用户选择1-5分,点击提交后,文章的评分次数(Stars) + 1、总分(StarTotal) + 分数、平均分(StarAvg) = 新总分 / 新评分次数
- 文章页面显示用户的平均分以及评分次数
评分功能中用户最多打5分,最少打1分,某日忽然发现有的文章平均分竟然大于5,很不可思议。出现这个问题,大致的原因大不过有:
- 实现评分逻辑的页面没有验证传入的分数是否合法、有些用户直接提交他们想要的分数来作弊;
- 评分逻辑无误,但计算平均分的算法错误
经检查,评分模块不仅验证了分数范围,而且验证了访问来源,用户根本不可能通过提交他们想要的分数达到修改平均分的目的;平均分算法也没有问题。
这就奇怪了,只能先查看一下SQL Server的事务日志,这里选用了Lumigent Log Explorer,文章的提交时间是2008-05-06 13:40,发现问题的时间是2008-05-06 14:10,于是
Lumigent Log Explorer 使用方法
1、打开软件主界面,点击左侧的“Attach log file”
2、在右侧的对话框先选择SQL Server的地址(我把Lumigent Log Explorer装在了数据库服务器上,所以选择的local),如图1
图1
3、点击Connect后,选择我们要查看的事务日志所属数据库,注意这里有两个选项:Use On-Line Log和Use Backup Log,这里普及一下SQL Server的事务日志知识:
- 事务日志会“忠实”记录一切你对数据库的操作,包括增加、删除表、字段,增删改查数据等等,我们在SQL Server企业管理器的管理(Management)、数据库维护计划(Database Maintenance Plan)、事务日志备份(Transaction Log Backup)选项卡中是可以设定事务日志的备份计划的,比如我们设定为1小时备份一次。
- 那么如果我们查看的事务日志还没有备份,我们选择Use On-Line Log,如果已经备份成了后缀名为TRN(这也是可以由你自定义的)的备份文件,我们选择Use Backup Log;如果未备份的、已备份的事务日志都需要查看,则都选
- 我这里只选User On-Line Log
点击Attach,加载相应的日志
4、在左侧菜单 Filter Log Records 中,如图2
图2
- 在TimeRange选项卡中选定上面的时间范围,如图3
图3 - 投票属于对表的修改,于是在Activity选项卡中只选ModifyRow、ModifyColumns,如图4
图4 - 在Table选项卡中只选文章表,如图5
图5
点击Apply后就可以看到所有符合条件的事务日志了,如图5-1
图5-1
Bug分析
经过仔细查询,我查到了3个对有问题的文章的操作,如图6、7、8
图6是对文章评分,我们可以看到:总分是5,评分次数是1,平均分是5,这是没错的;
图6
图7是对文章的修改,我们可以看到:平均分由5变为了0,评分次数由1变为了0,这是怎么回事呢?
图7
经思考得出结论,就在用户对文章评分前,作者刚刚对文章执行了修改操作,修改会
- 先建立一个指定文章ID的文章对象(实际是从数据库中读取指定ID的记录) ->
- 用户评分 ->
- 执行修改(实际就是把刚才建立的对象写入数据库,因为读取数据时还没有评分,所以写入的数据是评分前的数据)
现在搞明白了,拿北京话讲,太“寸”了;这也有办法解决,只需要用户修改文章时对指定ID的文章对象加锁,修改完后解锁,评分操作同样如此;
图8是又有用户对文章进行评分,我们看到总分变成了9,评分次数是1,平均分也变成了9
图8
到这里,真相大白:实际上是有2位用户对文章进行了评分,因为修改文章的Bug导致数据库只记录了1位。
问题有了:为什么修改文章时平均分归零、评分次数归零、恰恰总分没有归零呢?如果总分归零了,起码再有用户投票时是不会有平均分大于5的数据的。
忽然想起来,文章的数据库结构做过一次调整,调整的内容恰恰是增加了总分字段(StarTotal),而数据持久层却没有相应同步,所以在建立文章对象时,漏过了StarTotal这个字段,也就没有对这个字段进行修改。
至此,问题的原因、解决方法都出来了。
使用Lumigent Log Explorer恢复(撤销)事务、操作
我们常遇到误删除、修改数据的时候,利用Lumigent Log Explorer就可以做到只还原指定事务。
事务是对数据库的一系列操作,比如:UPDATE [dbo].[TestTable] SET [Passed] = 1,会对表[dbo].[TestTable]的所有记录的[Passed]字段进行赋值,我们在Lumigent Log Explorer看到的是一系列相同TransId的操作(如图5-1),只需要在这一系列操作的任意一个上点右键,选择Undo Transaction,即可对这个事务进行撤销(还原);
当然,我们也可以对事务的某一个操作进行撤销(还原),很简单,只需要按上面的步骤选择Undo Operation即可。
选择Undo Transaction或Undo Operatio后,Lumigent Log Explorer会生成一个标准的SQL语句文档,将这个文档的内容在查询分析器(Query Analyzer)里面执行即可撤销(还原)事务或事务中的操作。
问题
操作的内容包含ntext或者text字段时,Lumigent Log Explorer生成的SQL语句中没有这些字段的内容,这个问题如果哪位有解决方法,还望不吝赐教,谢谢先。