SQL Server 批量插入数据的两种方法

在SQL Server 中插入一条数据使用Insert语句,但是如果想要批量插入一堆数据的话,循环使用Insert不仅效率低,而且会导致SQL一系统性能问题。下面介绍SQL Server支持的两种批量数据插入方法:Bulk和表值参数(Table-Valued Parameters)。

运行下面的脚本,建立测试数据库和表值参数。

  1. --Create DataBase 
  2. create database BulkTestDB; 
  3. go 
  4. use BulkTestDB; 
  5. go 
  6. --Create Table 
  7. Create table BulkTestTable( 
  8. Id int primary key, 
  9. UserName nvarchar(32), 
  10. Pwd varchar(16)) 
  11. go 
  12. --Create Table Valued 
  13. CREATE TYPE BulkUdt AS TABLE 
  14.   (Id int
  15.    UserName nvarchar(32), 
  16.    Pwd varchar(16)) 

 

下面我们使用最简单的Insert语句来插入100万条数据,代码如下:

  1. Stopwatch sw = new Stopwatch(); 
  2.  
  3. SqlConnection sqlConn = new SqlConnection( 
  4.     ConfigurationManager.ConnectionStrings["ConnStr"].ConnectionString);//连接数据库 
  5.  
  6. SqlCommand sqlComm = new SqlCommand(); 
  7. sqlComm.CommandText = string.Format("insert into BulkTestTable(Id,UserName,Pwd)values(@p0,@p1,@p2)");//参数化SQL 
  8. sqlComm.Parameters.Add("@p0", SqlDbType.Int); 
  9. sqlComm.Parameters.Add("@p1", SqlDbType.NVarChar); 
  10. sqlComm.Parameters.Add("@p2", SqlDbType.VarChar); 
  11. sqlComm.CommandType = CommandType.Text; 
  12. sqlComm.Connection = sqlConn; 
  13. sqlConn.Open(); 
  14. try 
  15.     //循环插入100万条数据,每次插入10万条,插入10次。 
  16.     for (int multiply = 0; multiply < 10; multiply++) 
  17.     { 
  18.         for (int count = multiply * 100000; count < (multiply + 1) * 100000; count++) 
  19.         { 
  20.  
  21.             sqlComm.Parameters["@p0"].Value = count; 
  22.             sqlComm.Parameters["@p1"].Value = string.Format("User-{0}", count * multiply); 
  23.             sqlComm.Parameters["@p2"].Value = string.Format("Pwd-{0}", count * multiply); 
  24.             sw.Start(); 
  25.             sqlComm.ExecuteNonQuery(); 
  26.             sw.Stop(); 
  27.         } 
  28.         //每插入10万条数据后,显示此次插入所用时间 
  29.         Console.WriteLine(string.Format("Elapsed Time is {0} Milliseconds", sw.ElapsedMilliseconds)); 
  30.     } 
  31. catch (Exception ex) 
  32.     throw ex; 
  33. finally 
  34.     sqlConn.Close(); 
  35.  
  36. Console.ReadLine(); 

 

耗时图如下:

使用Insert语句插入10万数据的耗时图

由于运行过慢,才插入10万条就耗时72390 milliseconds,所以我就手动强行停止了。

下面看一下使用Bulk插入的情况:

bulk方法主要思想是通过在客户端把数据都缓存在Table中,然后利用SqlBulkCopy一次性把Table中的数据插入到数据库

代码如下:

  1. public static void BulkToDB(DataTable dt) 
  2.     SqlConnection sqlConn = new SqlConnection( 
  3.         ConfigurationManager.ConnectionStrings["ConnStr"].ConnectionString); 
  4.     SqlBulkCopy bulkCopy = new SqlBulkCopy(sqlConn); 
  5.     bulkCopy.DestinationTableName = "BulkTestTable"
  6.     bulkCopy.BatchSize = dt.Rows.Count; 
  7.  
  8.     try 
  9.     { 
  10.         sqlConn.Open(); 
  11.     if (dt != null && dt.Rows.Count != 0) 
  12.         bulkCopy.WriteToServer(dt); 
  13.     } 
  14.     catch (Exception ex) 
  15.     { 
  16.         throw ex; 
  17.     } 
  18.     finally 
  19.     { 
  20.         sqlConn.Close(); 
  21.         if (bulkCopy != null
  22.             bulkCopy.Close(); 
  23.     } 
  24.  
  25. public static DataTable GetTableSchema() 
  26.     DataTable dt = new DataTable(); 
  27.     dt.Columns.AddRange(new DataColumn[]{ 
  28.         new DataColumn("Id",typeof(int)), 
  29.         new DataColumn("UserName",typeof(string)), 
  30.     new DataColumn("Pwd",typeof(string))}); 
  31.  
  32.     return dt; 
  33.  
  34. static void Main(string[] args) 
  35.     Stopwatch sw = new Stopwatch(); 
  36.     for (int multiply = 0; multiply < 10; multiply++) 
  37.     { 
  38.         DataTable dt = Bulk.GetTableSchema(); 
  39.         for (int count = multiply * 100000; count < (multiply + 1) * 100000; count++) 
  40.         { 
  41.             DataRow r = dt.NewRow(); 
  42.             r[0] = count; 
  43.             r[1] = string.Format("User-{0}", count * multiply); 
  44.             r[2] = string.Format("Pwd-{0}", count * multiply); 
  45.             dt.Rows.Add(r); 
  46.         } 
  47.         sw.Start(); 
  48.         Bulk.BulkToDB(dt); 
  49.         sw.Stop(); 
  50.         Console.WriteLine(string.Format("Elapsed Time is {0} Milliseconds", sw.ElapsedMilliseconds)); 
  51.     } 
  52.  
  53.     Console.ReadLine(); 

 

耗时图如下:

使用Bulk插入100万数据的耗时图

可见,使用Bulk后,效率和性能明显上升。使用Insert插入10万数据耗时72390,而现在使用Bulk插入100万数据才耗时17583。

最后再看看使用表值参数的效率,会另你大为惊讶的。

表值参数是SQL Server 2008新特性,简称TVPs。对于表值参数不熟悉的朋友,可以参考最新的book online,我也会另外写一篇关于表值参数的博客,不过此次不对表值参数的概念做过多的介绍。言归正传,看代码:

  1. public static void TableValuedToDB(DataTable dt) 
  2.     SqlConnection sqlConn = new SqlConnection( 
  3.       ConfigurationManager.ConnectionStrings["ConnStr"].ConnectionString); 
  4.     const string TSqlStatement = 
  5.      "insert into BulkTestTable (Id,UserName,Pwd)"
  6.      " SELECT nc.Id, nc.UserName,nc.Pwd"
  7.      " FROM @NewBulkTestTvp AS nc"
  8.     SqlCommand cmd = new SqlCommand(TSqlStatement, sqlConn); 
  9.     SqlParameter catParam = cmd.Parameters.AddWithValue("@NewBulkTestTvp", dt); 
  10.     catParam.SqlDbType = SqlDbType.Structured; 
  11.     //表值参数的名字叫BulkUdt,在上面的建立测试环境的SQL中有。 
  12.     catParam.TypeName = "dbo.BulkUdt"
  13.     try 
  14.     { 
  15.       sqlConn.Open(); 
  16.       if (dt != null && dt.Rows.Count != 0) 
  17.       { 
  18.           cmd.ExecuteNonQuery(); 
  19.       } 
  20.     } 
  21.     catch (Exception ex) 
  22.     { 
  23.       throw ex; 
  24.     } 
  25.     finally 
  26.     { 
  27.       sqlConn.Close(); 
  28.     } 
  29.  
  30. public static DataTable GetTableSchema() 
  31.     DataTable dt = new DataTable(); 
  32.     dt.Columns.AddRange(new DataColumn[]{ 
  33.       new DataColumn("Id",typeof(int)), 
  34.       new DataColumn("UserName",typeof(string)), 
  35.       new DataColumn("Pwd",typeof(string))}); 
  36.  
  37.     return dt; 
  38.  
  39. static void Main(string[] args) 
  40.     Stopwatch sw = new Stopwatch(); 
  41.     for (int multiply = 0; multiply < 10; multiply++) 
  42.     { 
  43.         DataTable dt = TableValued.GetTableSchema(); 
  44.         for (int count = multiply * 100000; count < (multiply + 1) * 100000; count++) 
  45.         {         
  46.             DataRow r = dt.NewRow(); 
  47.             r[0] = count; 
  48.             r[1] = string.Format("User-{0}", count * multiply); 
  49.             r[2] = string.Format("Pwd-{0}", count * multiply); 
  50.             dt.Rows.Add(r); 
  51.         } 
  52.         sw.Start(); 
  53.         TableValued.TableValuedToDB(dt); 
  54.         sw.Stop(); 
  55.         Console.WriteLine(string.Format("Elapsed Time is {0} Milliseconds", sw.ElapsedMilliseconds)); 
  56.     } 
  57.  
  58.     Console.ReadLine(); 

 

耗时图如下:

使用表值参数插入100万数据的耗时图

比Bulk还快5秒。

posted @ 2013-11-05 11:24  简单的执着_俊  阅读(444)  评论(0编辑  收藏  举报