C#操作dbf
转自http://dotnet.chinaitlab.com/CSharp/838298.html
由于历史的原因,我国的上交所和深交所使用的还是dbf文件来进行行情数据的分发,关于卫星报盘系统,可以参考:http://maltig.itpub.net/post/12165/195151 这个博客中关于证券公司信息化的文章写的还是相当不错的。上交所使用的是show2003.dbf文件,而深交所使用的是SJSHQ.DBF,这种文件可以使用Visual FoxPro直接打开,查看其内容。接下来说说怎么使用C#读取其中的数据。
使用C#读取dbf文件,推荐使用OLE DB来读取(微软官方都不推荐使用ODBC来读),首先需要下载安装Microsoft OLE DB Provider for Visual FoxPro 9.0,接下来就可以使用C#操作OLE DB,连接字符串为:
Provider=vfpoledb;Data Source=C:\vfp;Collating Sequence=machine;
这里C:\vfp是一个文件夹路径,要读取的dbf文件就在这个文件夹下面;当然,如果dbf是在网络共享位置,那么也可以使用网络文件夹的路径。如果要读取深交所行情的所有数据,返回一个DataSet,那么对应的函数为:
public static DataSet ReadSJSHQ()
{
string strConn = @"Provider=vfpoledb;Data Source=C:\vfp;Collating Sequence=machine;";
using (OleDbConnection myConnection = new OleDbConnection(strConn))
{
OleDbDataAdapter adpt = new OleDbDataAdapter("select * from SJSHQ.DBF", myConnection);
DataSet mySet = new DataSet();
adpt.Fill(mySet);
myConnection.Close();
return mySet;
}
}
这个函数就可以把所有深交所的数据读取出来,如果要读取上交所的数据,那么就不会这么简单了,虽然使用这个方法把查询改成select * from show2003.dbf也能读取返回一个数据集,但是这个返回的数据集是不完整的,前面大约200多行数据没有读取出来。如果使用Visual FoxPro打开show2003.dbf文件可以查看到所有的数据内容。之所以没有返回前200多行的原因是因为dbf文件中将这些行置为删除状态了,所以如果要读取所有的数据行,那么需要设置当前读取的命令去掉删除标记。比如要读取上交所dbf文件中的所有S1列,那么对应的代码应该是:
public static DataSet ReadShow2003S1()
{
string strConn = @"Provider=vfpoledb;Data Source=C:\vfp;Collating Sequence=machine;";
using (OleDbConnection myConnection = new OleDbConnection(strConn))
{
myConnection.Open();
OleDbCommand cmd = new OleDbCommand();
cmd.Connection = myConnection;
cmd.CommandText = "SET DELETED OFF";//去掉删除标记,拿到所有记录
cmd.CommandType = CommandType.Text;
cmd.ExecuteNonQuery();
OleDbDataAdapter adpt = new OleDbDataAdapter("select s1 from show2003.dbf", myConnection);
DataSet mySet = new DataSet();
adpt.Fill(mySet);
myConnection.Close();
return mySet;
}
}
如果我们要获取show2003里面的所有行所有列的数据,那么使用sql命令“select * from show2003.dbf”是会抛出异常:
提供程序无法确定 Decimal 值。例如,该行刚刚创建,未提供 Decimal 列的默认值,并且使用者尚未设置新 Decimal 值。
而在不读取有删除标记的行时是不会报错的,这是因为前面的行中有些列值的问题,用Visual Foxpro打开show2003.dbf文件,可以看到第一行S1为000000的数据行,其S6列是当前dbf文件数据生成的日期,比如我现在的S6值为20101209,这一列的数据定义是“数值型,宽度8,小数位数3”,据说是设计上的Bug,参见:http://blog.csdn.net/zenithyr/archive/2010/03/11/5367321.aspx,于是我们如果要正常读取这个表的话需要对第一行做特别处理。其实本来第一行就需要特殊处理的,因为第一行并不是实际的数据,第一行主要是说明这个文件产生的日期时间之类的,所有我使用的就是简单粗暴的方法,使用2个DataSet来返回这些数据,具体函数代码为:
public static DataSet ReadShow2003(DataSet mySet0)
{
string strConn = @"Provider=vfpoledb;Data Source=C:\vfp;Collating Sequence=machine;";
using (OleDbConnection myConnection = new OleDbConnection(strConn))
{
myConnection.Open();
OleDbCommand cmd = new OleDbCommand();
cmd.Connection = myConnection;
cmd.CommandText = "SET DELETED OFF";//去掉删除标记,拿到所有记录
cmd.CommandType = CommandType.Text;
cmd.ExecuteNonQuery();
//单独读取第一行
OleDbDataAdapter adpt0 = new OleDbDataAdapter("SELECT s1,s2,s3,s4,s5,str(s6) as s6,s11,s13,s15,s17 from show2003 where s1=\"000000\"", myConnection);//只有这几个字段有值
adpt0.Fill(mySet0);
//接下来读取其他行
OleDbDataAdapter adpt = new OleDbDataAdapter("SELECT * from show2003 where s1<>\"000000\"", myConnection);
DataSet mySet = new DataSet();
adpt.Fill(mySet);
myConnection.Close();
return mySet;
}
}