记录今天客户的SQLSERVER启动不起来( 错误9003)的解决过程2013-11-26
记录今天客户的SQLSERVER启动不起来( 错误9003)的解决过程2013-11-26
今天一大早上班就接到客户的电话,说:SQLSERVER启动不起来,业务系统使用不了
于是我就使用QQ远程,帮客户解决问题
环境
先说一下环境
客户环境:Windows2003企业版SP2 32位 SQL2005企业版 32位 SP4
自己笔记本电脑环境:Windows7 SP1 32位 SQL2005个人开发者版 32位
我的笔记本电脑的计算机名:joe
客户电脑的计算机名:hs
客户那边的master数据库大小:几MB
业务系统是winform系统
客户的环境是单机系统没有使用到域
网络环境:客户那边的网速比较慢,用远程协助的时候比较卡
为什麽要说明我自己笔记本电脑的环境呢?请大家继续耐心看下去
检查
先打开SQLSERVER配置管理器,启动SQLSERVER,发现SQLSERVER启动不起来
于是我打开Windows EventLog,发现了下面错误
SQLSERVER 错误9003:LSN无效(日志扫描号无效)
"传递给数据库 'master' 中的日志扫描操作的日志扫描号 (2806:120:1) 无效。
此错误可能指示数据损坏,或者日志文件(.ldf)与数据文件(.mdf)不匹配。
如果此错误是在复制期间出现的,请重新创建发布。否则,如果该问题导致启动期间出错,请从备份还原。
于是我就在自己的电脑上百度了一下这个错误
搜索到这篇文章:sql server 错误9003:LSN无效(日志扫描号无效),对数据库的修复
这篇文章里的数据库是用户数据库,用rebuild log,dbcc checkdb解决了问题
悲催的是客户那边损坏的是master数据库
想办法
作为一个好的数据库工程师,一定要快速知道有哪些方法可以解决当前客户的问题
这些方法有什么利弊,因为延迟一秒钟,就会造成客户更多的损失,客户的业务系统无法正常运作,后果可想而知
由下面几个因素,我作出了一个选择
网速比较慢,不方便在客户的电脑上写SQL语句
客户那边的master数据库大小:几MB
业务系统是winform系统
选择:以前项目经理教我的一个方法,遇到SQLSERVER启动不起来
可以用刚刚安装好的SQLSERVER的master数据库替换掉客户那边的master数据库
这种方法有下面的弊端
(1)你所用的数据库版本一定要和客户的一样
(2)将SQLSERVER2012的master数据库给客户是不行的
(3)服务器触发器,证书,链接服务器,登录用户等信息会丢失
为什麽会有这些弊端,大家可以看一下下面的文章
SQL Server 2008中的Service SID 介绍
【SERVICE SID的引入】
NT SERVICE\MSSQL$KATMAI, NT SERVICE\SQLAgent$KATMAI和NT SERVICE\ClusSvc 其实都是Service SID所对应的名字。Service SID的引入,是为了解决多个Service可能同用一个service帐号所带来的安全隐患。
如IIS 使用Network Service帐号,可能其他服务也使用Network Service帐号。
为了使得IIS能够连接到SQL Server, 我们可能会把Network Service作为SQL Server的login, 但是这是不安全的。
因为其他服务如果以Network Service做为启动帐号的话,也能访问SQL Server。
为了解决这个问题,在SQL Server 2008/Windows Server 2008及以后,
我们有了SID这个概念,这样,不同的服务,即使服务启动帐号是相同的,它们的SID也是不同的。
hs\administrators
hs\SQLServer2005MSFTEUser$hs$MSSQLSERVER
hs\SQLServer2005MSSQLUser$hs$MSSQLSERVER
hs\SQLServer2005SQLAgentUser$hs$MSSQLSERVER
但是如果我把自己的master数据库给客户的话,就会变成下面的样子
如果客户的业务系统是B/S系统,会用到IIS,或者客户的环境是域环境,
登录SQLSERVER需要使用Windows登录验证不是SQL登录验证,那么这样做就很麻烦了
还有一个我自己电脑的SQLSERVER是个人开发者,客户的是企业版,不过之前也这样做过,发现没有什么问题
开始实施
弊端说完了,开始实施了
第一步:先把我自己笔记本电脑上的SQLSERVER所有用户数据库全部分离,
删除一些安装时候没有的登录用户只保留默认的登录用户,停止自己电脑的SQL服务,然后把master.mdf和mastlog.ldf复制出来,发给客户
第二步:使用远程协助,把客户电脑里的master数据库master.mdf文件改名为master22.mdf
mastlog.ldf文件改名为mastlog22.ldf
然后把发过来的master数据库放进去data文件夹里
第三步:启动SQLSERVER,由于当时没有截图,这里就不放截图了,这时候可以发现SQLSERVER成功启动了
第四步:把我们的业务库重新附加进来
第五步:删除原来业务库里的那个数据库用户gxhtsyrain
第六步:新建登录用户gxhtsyrain并且映射到我们的业务库
第七步:禁用sa用户
由于不是替换msdb数据库,所以维护计划没有丢失
错误日志
我查看SQL ERRORLOG,发现了下面的错误
无法启用数据库 "msdb" 中的 Service Broker,因为master与msdb 的 Service Broker 的ID不一样
NT AUTHORITY\SYSTEM登录失败
由于我们没有用到 Service Broker技术,所以“无法启用数据库 "msdb" 中的 Service Broker”这个错误可以忽略
而NT AUTHORITY\SYSTEM登录失败,在文章SQL Server 2008中的Service SID 介绍中说到
但是我们也不能认为有这几个SID的帐号,就能随便把其他的登录如NT AUTHORITY\SYSTEM给删除。
某些应用,如VSS Writer,Windows自动更新等,还是需要用服务启动帐号来进行处理。
因为客户的SQLSERVER已经打了SP4补丁,不会再打补丁,所以就算用不了Windows自动更新也没有关系
如果客户那边有做SQLSERVER的系统数据库备份
我会这样做:
第一步:先备份我自己笔记本电脑里的master数据库出来
第二步:将客户那边的master.bak拿到自己的电脑里
第三步:还原客户的master.bak到自己的SQLSERVER
第四步:停止SQL服务,然后把master.mdf和mastlog.ldf复制出来发送给客户
第五步:把客户电脑里的master数据库master.mdf文件改名为master22.mdf,mastlog.ldf文件改名为mastlog22.ldf
第六步:然后把发过来的master数据库放进去data文件夹里
第七步:启动SQLSERVER
总结
其实除了备份用户数据库之外,系统数据库的备份也是很重要的
我们需要备份master和msdb这两个数据库
我们当时部署业务系统的时候没有备份系统数据库,其实也是一个反面教材
我的方法是基于我们的业务系统使用到SQLSERVER的功能就只有维护计划,所以作出上面的的解决方法
如果用到很多SQLSERVER的相关技术的话,可能我的解决方法不是最好的
我也希望大家能够提出您的意见和见解,或者您使用的方法比我还要好,更快速
如有不对的地方,欢迎大家拍砖o(∩_∩)o