ADO.NET 2.0中的DataSet和DataTable
MSDN2005年11月刊登载了John Papa的一篇文章《DataSet and DataTable in ADO.NET 2.0》,详细介绍了ADO.Net 2.0的一些新功能和特性,对于利用ADO.NET开发的程序员来说,是值得关注的。现介绍如下:
一.功能增强的DataTable
在ADO.NET1.x中,DataSet完全掩盖了DataTable的光芒,并非DataTable自身功能不够强大,实则是比较DataSet而言,很多功能在1.x版本中受到了限制。例如Merge功能,在ADO.NET1.x版本中,如果要合并两个表,只有是通过DataSet的Merge方法,才能完成,代码如下:
string sqlAllCustomers = "SELECT * FROM Customers";
string cnStr = @"Data Source=.;Initial Catalog=northwind;Integrated Security=True";
using (SqlConnection cn = new SqlConnection(cnStr))
{
cn.Open();
SqlCommand cmd = new SqlCommand(sqlAllCustomers, cn);
SqlDataAdapter adpt = new SqlDataAdapter(cmd);
DataTable dtCust1 = new DataTable("Customers");
adpt.Fill(dtCust1);
dtCust1.PrimaryKey = new DataColumn[]{dtCust1.Columns["CustomerID"]};
DataTable dtCust2 = dtCust1.Clone();
DataRow row1 = dtCust2.NewRow();
row1["CustomerID"] = "ALFKI";
row1["CompanyName"] = "Some Company";
dtCust2.Rows.Add(row1);
DataRow row2 = dtCust2.NewRow();
row2["CustomerID"] = "FOO";
row2["CompanyName"] = "Some Other Company";
dtCust2.Rows.Add(row2);
DataSet ds = new DataSet("MySillyDataSet");
ds.Tables.Add(dtCust1);
ds.Merge(dtCust2);
dgTest.DataSource = dtCust1;
}
在ADO.NET 2.0中,对DataTable作了改进,同样提供了Merge方法。因此如上的代码中,如果要合并表dtCust1和dtCust2,就不必再引入DataSet对象了:
dtCust1.Merge(dtCust2);
此外,ADO.NET1.x版本中,DataTable也无法完成Xml文件和数据表之间的转换。这个问题在2.0版本中,也得到了改进,DataTable也具备了和DataSet对象同样的操作xml文件的能力,包括方法ReadXml,WriteXml等。
DataSet和DataTable在2.0版本中,还提供了一个新的属性RemotingFormat。在对DataTable和DataSet对象进行序列化时,该属性标示序列化的格式是二进制还是xml。
二.轻量级对象和快速遍历
ADO.NET 2.0中的DataTable提供了CreateDataReader方法(在之前的版本名为GetDataReader),该方法将创建一个DataTableReader对象。DataTableReader与DataTable不同,它是一个轻量级的对象,其支持Disconnected,这一点与DataReader(SqlDataReader)不同。这些特点决定遍历DataTableReader对象将更加快速,占用的数据资源更少(Disconnected)。下面的代码创建了一个DataTableReader对象,并将其绑定到DataGridView控件上:
using (SqlConnection cn = new SqlConnection(cnStr))
{
SqlCommand cmd = new SqlCommand(sqlAllCustomers, cn);
SqlDataAdapter adpt = new SqlDataAdapter(cmd);
DataTable dtCustomers = new DataTable("Customers");
adpt.Fill(dtCustomers);
DataTableReader dtRdr = ds.CreateDataReader();
dgvCustomers.DataSource = dtRdr;
}
和DataReader一样,DataTableReader对象只能向前遍历,可以通过Read方法,定位到对象的第一行。如果DataTableReader如果是被一个包含有多个数据表的DataSet对象创建,DataTableReader也会包含多个结果集。通过调用NextResult方法,访问结果集序列。
using (SqlConnection cn = new SqlConnection(cnStr))
{
// Create the Command and Adapter
SqlCommand cmd = new SqlCommand(sqlAllCustomers, cn);
SqlDataAdapter adpt = new SqlDataAdapter(cmd);
// Create a DataTable and fill it
DataTable dtCustomers = new DataTable("Customers");
adpt.Fill(dtCustomers);
DataSet ds = new DataSet();
ds.Tables.Add(dtCustomers);
adpt.SelectCommand = new SqlCommand("SELECT * FROM Orders", cn);
adpt.Fill(ds, "Orders");
// Create the DataTableReader (it is disconnected)
using(DataTableReader dtRdr = ds.CreateDataReader())
{
do
{
Console.WriteLine("******************************");
while (dtRdr.Read())
{
Console.WriteLine(dtRdr.GetValue(0).ToString());
}
}
while (dtRdr.NextResult());
}
}
DataTableReader对象中数据表的顺序与DataSet中的数据表顺序一致。如果你需要制定特定的顺序,可以通过重载CreateDataReader方法来实现。
三.装载数据
可以通过DataTableReader对象生成DataTable和DataSet。利用DataTable和DataSet在2.0版本中新引入的方法Load,可以传递DataTableReader或者任何实现IDataReader接口的类对象。下面的代码就是通过Load方法将dt1的数据传递到新的数据表dt2中:
DataTableReader dtRdr = dt1.CreateDataReader();
DataTable dt2 = new DataTable();
dt2.Load(dtRdr);
在使用Load方法装载多行数据时,可以先调用BeginLoadData方法来避免通知(notifications),索引维护(index maintenance)以及约束检查(constraint checking),然后再通过EndLoadData方法返回数据。
四.性能改进
这恐怕是ADO.NET 2.0最激动人心的改进。在1.x版本中,随着数据的增大,在使用DataTable和DataSet对象时,性能是不能令人满意的。ADO.NET 2.0对索引引擎作了很大的改进,使得2.0的数据访问能力获得极大的提高。以下面的测试代码为例:
DataTable dt = new DataTable("foo");
DataColumn pkCol = new DataColumn("ID", Type.GetType("System.Int32"));
pkCol.AutoIncrement = true;
pkCol.AutoIncrementSeed = 1;
pkCol.AutoIncrementStep = 1;
dt.Columns.Add(pkCol);
dt.PrimaryKey = new DataColumn[] { pkCol };
dt.Columns.Add("SomeNumber", Type.GetType("System.Int32"));
dt.Columns["SomeNumber"].Unique = true;
int limit = 1000000;
int someNumber = limit;
DateTime startTime = DateTime.Now;
for (int i = 1; i <= limit; i++)
{
DataRow row = dt.NewRow();
row["SomeNumber"] = someNumber—;
dt.Rows.Add(row);
}
TimeSpan elapsedTime = DateTime.Now - startTime;
MessageBox.Show(dt.Rows.Count.ToString() + " rows loaded in " + elapsedTime.TotalSeconds + " seconds.");
分别在Visual Studio.NET 2003和Visual Studio 2005环境下运行,结果比较如下:
Iterations |
ADO.NET 1.1 |
ADO.NET 2.0 |
10,000 |
0.20 |
0.20 |
100,000 |
7.91 |
3.89 |
1,000,000 |
1831.01 |
23.78 |