使用复制存储过程执行解决“事务复制中的表大量更新导致无法及时同步”的问题 (转)
复制存储过程执行应用于事务复制中,当在发布服务器上执行配置的存储过程时,存储过程导致的数据变更不会做为多步骤事务发送到订阅服务器,而仅仅是把执行存储过程的命令发送到订阅服务器。
比如,如果你为一个100万条记录的表增加了一个字段,并且初始化为一个值,如果不使用复制存储过程执行的话,那么这个操作就会形成100万个更新操作发送到订阅服务器,订阅服务器将将进行100万次更新,这个操作通常会花费很长时间,并导致后续的数据变更也无法得到及时的同步。
如果使用复制存储过程执行的话,你可以创建一个存储过程来实现这个更新,并且把这个存储过程添加到事务复制中,然后当你在发布服务器上执行完成这个存储过程后,这个执行操作会衩发送到订阅服务器,订阅服务器将执行同样的调用存储过程的操作来完成这100万记录的更新。由于在发布和分发服务器之间不存在大量的数据传递,更新操作也不是100万个更新,所以这个操作会很快完成,因此你的同步延迟也会非常小。
复制存储过程的关键是发布项目属性中,为存储过程配置项目属性时,将“复制”项设置为“存储过程执行”,或者是“SP 的序列化事务中执行”,如图所示
(如果你是用T-SQL来创建发布,则是将 sp_addarticle 存储过程的 @type 参数设置为“proc exec”,或“serializable proc exec”)
其中,“SP 的序列化事务中执行”是推荐的行为,要求你的存储过程是在序列化事务中,也就是SET TRANSACTION ISOLATION LEVEL SERIALIZABLE。至于原因和详细的资料,可能参考联机帮助:
http://msdn.microsoft.com/zh-cn/library/ms152754(SQL.90).aspx
值得注意的是,由于订阅服务器上的存储过程是可以修改的,所以利用这个,你还可能实现更多的与大批量数据相关的操作。例如,你可能有一些大表,这些表被同步到报表服务器上,在你的发布服务器上,你只关心最新的数据(可能是最近2年),而在报表服务器上,你需要所有的数据。所以,在发布服务器上,你可能有一个定期删除历史数据的Job,而在报表服务器上,则不能删除,你可能会考虑通过配置筛选来做到发布上的删除不同步到订阅,但如果某天不小心重新初始化了一次,则数据就丢失了。而利用复制存储过程执行的话,你可以在发布服务器上定义存储过程的内容为删除,在订阅服务器上定义存储过程为删除并且OUTPUT 到历史表,这样发布和订阅的表是一样的,不担心重新初台化导致数据丢失。唯一要注意的是,你在发布服务器上修改存储过程的话,这个修改会同步到订阅服务器,当然,这个问题也容易解决,你可以在存储过程里面判断服务器名字来完成不同的操作,这样就万无一失了。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
2011-07-22 微软金牌(Gold Data Platform)和两个一块钱硬币