Execute SQL Task 第三篇:参数和变量的映射
Execute SQL Task能够执行带参数的SQL查询语句或存储过程(SP),通过SSIS的变量(Variable)对参数赋值。对于不同的Connection Manager,在Task中需要使用不同的符号(Parameter marker)来标记一个参数,并且在Parameter Mapping中设置参数名字(Parameter Name)。
在Execute SQL Task Editor中,设置Parameter Mapping的界面如下:
- Variable Name:变量的名字,变量的作用域分为User和System,使用 :: 来引用作用域中的变量
- Direction:参数的方向,分为输入参数(Input),输出参数(Output)和返回值(Returnvalue)
- Data Type:参数的Data Type,必须和变量(Variable)的数据类型相兼容
- Parameter Name:参数名字,不同的Connection Manager,其值不同,对于OLEDB Connection Manager,使用0,1,2等数值表示第一个,第二个参数,第三个参数等。
- Parameter Size:默认值是-1,表示让SSIS确定参数的长度。如果参数的数据类型是变长的(varchar或varbinary),必须设置参数的长度,为参数值分配足够长度的空间。
在Parameter Mapping中,Parameter Marker和Name受到Connection Type的影响,如下表:
Connection type | Parameter marker | Parameter name | Example SQL command |
ADO | ? | Param1, Param2, … | SELECT FirstName, LastName, Title FROM Person.Contact WHERE ContactID = ? |
ADO.NET | @<parameter name> | @<parameter name> | SELECT FirstName, LastName, Title FROM Person.Contact WHERE ContactID = @parmContactID |
ODBC | ? | 1, 2, 3, … | SELECT FirstName, LastName, Title FROM Person.Contact WHERE ContactID = ? |
EXCEL and OLE DB | ? | 0, 1, 2, 3, … | SELECT FirstName, LastName, Title FROM Person.Contact WHERE ContactID = ? |
1,执行SQL查询语句
楼主在实际开发中,最常用的Connection Type是OLEDB,设置Task的ConnectionType为OLE DB,在SQLStatement属性中使用 ? 来标记一个参数,? 叫做参数标记(Parameter Marker)。
select ID,c1 from dbo.dt_test where c1=?
使用SSIS 变量(Variable)为参数赋值,Parameter Name必须是0,1,2等数字
2,执行SP,设置参数的方向
使用Execute SQL Task执行SP时,参数映射的Direction属性使用Input,Output和Returnvalue 分别表示:输入参数,输出参数和SP的返回值
declare @return_value int declare @output_var int declare @input_var int set @input_var=1
exec @return_value=dbo.usp_test @para1=@input_var, @para2= @output_var output;
使用OLEDB Connection Manager,使用 ? 表示一个参数,如图
在Parameter Mapping Tab中设置参数映射:
- 第一个参数是SP的返回值,Direction 选择 Returnvalue,Parameter Name 是 0;
- 第二个参数是SP的输入参数,Direction 选择 Input,Parameter Name 是 1;
- 第三个参数是SP的输出参数,Direction 选择 Output,Parameter Name 是 2;
3,设置参数的Data Type
楼主整理的参数的Data Type和TSQL 数据类型的映射关系
3.1,数值类型
- BYTE:映射 SSIS 的 DBTYPE_UI1,映射 TSQL 的 TinyInt
- SHORT:映射 SSIS 的 DBTYPE_I2, 映射 TSQL 的 smallint
- LONG:映射 SSIS 的 DBType_I8,映射 TSQL 的 bigint
- FLOAT: 映射 TSQL 的 float(24)
- DOUBLE:映射 TSQL 的 float(53)
- DECIMAL: 映射 TSQL 的 decimal
3.2,日期/时间类型
- DATE:映射TSQL的DateTime2(7)
- DBDATE:映射TSQL的Date
- DBTIME:映射TSQL的time(2)
- DBTIME2:映射TSQL的time(7)
- DBTIMESTAMP:映射TSQL的Datetime
- FILETIME:映射TSQL的datetime
注意:如果SSIS 变量的Data Type是DateTime,那么参数的Data Type应使用 DATE,但是,数据类型为DateTime的变量,只保留到秒,毫秒位是0.
3.3,字符串类型
- VARCHAR: 映射TSQL的varchar
- NVARCHAR: 映射TSQL的nvarchar
4,在做增量更新时,发现导入的数据量少于源数据
楼主在调试SSIS Package时,使用ModifiedDate字段做增量更新,Package中使用Execute SQL Task获取数据源中DataUpdateTime字段的最大值,并将该值赋值给变量:User::MaxLastModifiedDate,Package运行成功,但是导入的数据量少于源数据;通过测试,发现DateTime类型的变量,其时间部分只保留到秒,而不会计算毫秒部分,导致导入的数据量少于源数据。
调试SSIS Package,下断点(breakpoint),打开Watch Tab,查看变量运行时的值:
这两个变量定义为DateTime类型,经过测试,如果变量定义成String类型,实际上是一样的,时间只会精确到秒:
然而,数据源中的DataUpdateTime使用的Datetime2(7),精度十分高:
发生这种问题的根源是 SSIS的数据类型和SQL Server的数据类型不是一一对应的,存在差异。为了避免这种问题,可以对MaxLastModifiedDate 变量加1s。
在使用OLEDB数据源导入数据时,使用如下的Where条件,就能把所有的数据都导入到DW中。
where DataUpdatedOn > ? --MinLastModifiedDate and DataUpdatedOn<=? --MaxLastModifiedDate
注意:SSIS 变量的日期和时间类型只保留到秒,而数据库中的时间可以保留到毫秒位(1-7位毫秒数)
参考文档:
SQL Server SP2 – What’s new for SSIS