伯乐共勉

讨论。NET专区
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

Sybase批量操作(BCP)的设计和实现

Posted on 2006-07-14 14:49  伯乐共勉  阅读(891)  评论(0编辑  收藏  举报

Sybase批量操作(BCP)的设计和实现

李伟华(msn:liweihua200204@hotmail.com)

摘要

本文主要讲述了Sybase数据库批量操作(BCP)的设计和实现,以及在开发过程中的关键点,为后续开发者提供了技术基础

关键词 Sybase 批量操作 BCP 设计 实现

一、前言

在项目研发过程中,需要开发一个数据库批量操作的动态链接库(DLL),以前的实现主要是程序中直接调用bcp.exe,这种方式由应用程序创建子进程,不好控制批量操作过程,失败跟踪难度比较大,因此想利用bcp.exe调用的函数来实现操作过程。本人通过分析bcp.exe程序,得到了批量操作的DB LIBRARY API函数,再查阅API函数的资料得以实现该动态链接库。

二、实现

批量操作动态链接库只实现了一个输出函数, 应用程序通过动态加载DLL,再获取函数地址,便可调用函数实现批量操作。

输出函数定义如下:
LIBBCP_API BOOL BCP_Transfer_2(const char *task, const char *step, const char *config, long *copiedrow);
在动态链接库中定义了两个类:CInteriorGlobal和CSYBBCP。CInteriorGlobal完成全局的初始化操作,CSYBBCP实现数据库的批量操作。

在调用Sybase数据库的DB LIBRARY API函数进行数据库的相关操作时,首先需要调用dbsetversion函数设置版本信息,这个函数只能调用一次,如果再次调用则会报错。而类CSYBBCP在BCP_Transfer_2函数中动态创建和释放,如果在CSYBBCP中直接调用dbsetversion会导致多次调用出错。因此需要采用一种机制让dbsetversion只能调用一次,这里使用了设计模式中的SingleTom模式,SingleTom模式就是确保实例唯一,本人利用该类仅做一次实例化操作来初始化Sybase客户端版本信息。

下面是CInteriorGlobal的定义:

class CInteriorGlobal
{
public:
static CInteriorGlobal *Instance();
private:
CInteriorGlobal();
private:
static CInteriorGlobal *_instance;
};
CInteriorGlobal的实现,在构造函数中设置版本信息:
CInteriorGlobal::CInteriorGlobal()
{
dbsetversion(DBVERSION_100);
}
CInteriorGlobal    *CInteriorGlobal::_instance  = 0;
CInteriorGlobal * CInteriorGlobal::Instance()
{
if(0 == _instance)
_instance = new CInteriorGlobal;
return _instance;
}
为了完成批量操作,定义类CSYBBCP,具体定义如下:
class CSYBBCP
{
public:
CSYBBCP();
~CSYBBCP();
BOOL        DoConnect(int taskindex, int stepindex, char *server, char *database, char *username,
char *password, char *charset, char *language);
BOOL        DoQuery(char *sql, char **buf, int *rowcount, int *fieldcount);
BOOL        DoUpdate(char *sql, char *database = NULL);
BOOL        BCP_Connect(int taskindex, int stepindex, char *server, char *database,
char *username, char *password, char *charset, char *language);
BOOL        BCP_Transfer_db(char *sql, char *fldterminator, char *rowterminator, int direction,
char *datafile, char *errfile, long *copiedrow);
private:
BOOL        m_isbcpout;
int         m_stepindex;
int         m_taskindex;
char        m_viewname[MAX_STRING_NUM];
char        m_database[MAX_STRING_NUM];
DBPROCESS  *m_dbproc;
private:
int         GetTableFieldNums(char *table);
BOOL        DoDisconnect();
};
在类CSYBBCP中,主要是函数BCP_Transfer_db进行数据库大批量数据的导入和导出,要完成数据传输操作,需要如下几个步骤:
// 初始化:指定表明和数据文件
if(bcp_init(m_dbproc, tablename, datafile, NULL, direction) == FAIL)
{
return FALSE;
}
// 设置批量操作的控制参数,这里设置的每批记录数
if(bcp_control(m_dbproc, BCPBATCH, (DBINT) 1000) == FAIL)
{
return FALSE;
}
// 设置列数
if(bcp_columns(m_dbproc, cCols) == FAIL)
{
return FALSE;
}
// 设置列格式
for(ii = 1; ii < cCols; ii++)
{
if(bcp_colfmt(m_dbproc, ii, SYBCHAR, 0, -1, (UINT8 *) fldterminator, _strlen(fldterminator), ii) == FAIL)
{
return FALSE;
}
}
if(bcp_colfmt(m_dbproc, ii, SYBCHAR, 0, -1, (UINT8 *) rowterminator, _strlen(rowterminator), ii) == FAIL)
{
return FALSE;
}
// 执行批量操作
while(bcp_exec(m_dbproc, & cRows) == FAIL)
{
return FALSE;
}
// 批量操作结束
retcode = bcp_done(m_dbproc);
在使用Sybase12.5客户端之前,程序未调用bcp_control函数,在执行bcp_exec函数时不是使用while,而是使用if判断,代码如下:
if(bcp_exec(m_dbproc, & cRows) == FAIL)
{
return FALSE;
}
程序能正常完成功能,当使用Sybase12.5客户端后,在执行时发现程序突然退出,异常处理也未能记录日志,后跟踪发现程序是在执行bcp_exec时退出,但是未能查出原因,咨询Sybase公司技术人员,也没能解决问题。后来在一次测试中偶然发现有时能导入数据,于是测试数据文件在什么情况下能导入,实验其临界点,多次测试后发现文件1000条记录为临界点,超过则出现问题。于是本人在程序中调用bcp_control函数,设置批量记录为1000,如果数据文件记录多于1000,则需要bcp_exec执行多次才能完成,所以采用while,而不是if,这样问题解决。

三、结束

在上面的论述中,还仅仅涉及DB LIBRARY,对于Sybase客户端编程,还有CT LIBRARY方式,目前CT已经支持导出,但不支持导入。