tableDiff的原理测试

    看了一下tablediff的比较,网上有些文章说NULL不能比较,但是同步测试了SQL 2008 的功能,发现其实能够比较出NULL值的。

运行tablediff命令:SQL Profiler 跟踪出以下sql:  

SELECT  [dbo].[Tmp].[ID],
        BINARY_CHECKSUM([dbo].[Tmp].[Account][dbo].[Tmp].[CharName],
                        [dbo].[Tmp].[ID]as MShash_54267293
FROM    [dbo].[Tmp] WITH ( READUNCOMMITTED )
ORDER BY [dbo].[Tmp].[ID]


SELECT  [dbo].[Tmp_Check].[ID],
        BINARY_CHECKSUM([dbo].[Tmp_Check].[Account],
                        [dbo].[Tmp_Check].[CharName][dbo].[Tmp_Check].[ID]as MShash_54267293
FROM    [dbo].[Tmp_Check] WITH ( READUNCOMMITTED )
ORDER BY [dbo].[Tmp_Check].[ID]
 

   判断表中某一行的不同,使用了BINARY_CHECKSUM函数       

     按照表的某一行或表达式列表计算的二进制校验和值。BINARY_CHECKSUM 可用于检测表中行的更改
     指定对表中的所有列进行计算。BINARY_CHECKSUM 在计算中忽略具有不可比数据类型的列。不可比数据类型包括 textntextimagecursorxml 和不可比公共语言运行库 (CLR) 用户定义的类型。

    如果发现目标库没有: 

SELECT [dbo].[Tmp].[Account],[dbo].[Tmp].[CharName],[dbo].[Tmp].[ID] FROM [dbo].[Tmp] WITH (READUNCOMMITTED) WHERE [ID] = 1

    执行上面语句生成 insert语句。是一条一条生成。

  如果目标库有不一样的

 SELECT [dbo].[Tmp_Check].[Account],[dbo].[Tmp_Check].[CharName],[dbo].[Tmp_Check].[ID] FROM [dbo].[Tmp_Check] WITH (READUNCOMMITTED) WHERE [ID] = 4

   目标库也会执行上面的查询得出哪个列不一样和生成更新sql

   以上如果在SQL 2008 中执行tablediff生成大量数据会很慢,同时也会造成内存溢出。

  总结(适用于SQL 2008 SP3):

     1,tablediff 会忽略不可比较的字段

     2,NULL也会比较出来

     3,比较是先全部查询出数据,再把不同的行查出具体数据生成insert,update,delete 语句

     4,数据量大时性能影响很大

 

 

posted @ 2012-08-13 17:28  zping  阅读(902)  评论(1编辑  收藏  举报