05 2015 档案
摘要:利用Script Task,我们可以做一些本身SSIS没能满足我们的,或者实现起来效果不够理想的。比如说我们想做一件这样的事情,去检查某个文件是否为空。如果我们通过Row Count组件来实现,性能上不理想,因为我又并不需要要知道究竟文件包含多少行数据。我们只需要简单地知道文件是否包含数据。我们可以...
阅读全文
摘要:Look up:Look up组件做的事情和SQL SERVER中的inner和outer hash join差不多。但是look up每次只能有两张表参与。在FULL-CACHE模式下,两个source的其中一个会被完整地load进内存,然后另一个source每次load一部分数据进到缓冲区再做匹...
阅读全文
摘要:有时我们需要生成一个文件,文件名的构成是当前时间的特定字符串格式,如yyyyMMddHHmmss当前时间变成yyyyMMddHHmmss这个格式:(DT_WSTR,4) YEAR(GETDATE()) + RIGHT(“0” +(DT_WSTR,2) MONTH(GETDATE()), 2) + R...
阅读全文
摘要:SSIS不支持值为NULL的变量。每种类型的变量都有自己的默认值。做了一个测试,用一个Execute SQL Task输出一个NULL值给A变量,然后把A变量传到到另外一个Execute SQL Task插入表,得到的值是0。这里可以证明确实在《Professional Microsoft SQL ...
阅读全文
摘要:变量和参数的数据类型一致,只是参数比变量少了诸如object这种可选类型。和SSIS数据类型的映射关系
阅读全文
摘要:变量的特点:1)大小写敏感2)可见范围限制,里层可以看到外层,外层看不到里层的;在属性窗口开启EvaluateAsExpression选项可以支持expression动态赋值变量
阅读全文
摘要:SSIS和SQL SERVER, .NET数据类型的映射表
阅读全文
摘要:参数只能外部调用参数分项目级别的参数和包级别的参数。项目级别的参数可见范围是所有包,而包级别的参数可见范围仅限于该包内。Sensitive选项是加密数据值,这样在Integration Services的Catalog就看不到该包这个Parameter的值。参数是不能用Expression来赋值的参...
阅读全文
摘要:Term Lookup是和Term Extraction相反的一个组件。Term Extraction是为了找出term,Term Lookup是利用我们关心的term list来找出某个文本里面包含多少该关键字。
阅读全文
摘要:中文意思是关键词抽取,用于计算在文本中哪些词汇或者词组出现的频率最高。其实算法有两张:1)Frequency 2)TFIDFTFIDF的全称是Term Frequency and Inverse Document Frequency,是一个用于计算单词或词组在在整个文本中出现的几率。下面是这个公式的...
阅读全文
摘要:这个组件和SQL Server的Pivot基本就是一回事。不过我观察到SSIS的Pivot只支持SUM这种聚合类型,并没有找到哪个选择可以设置聚合类型,而T-SQL语法的Pivot则支持多种聚合类型,包括MAX,MIN,AVG,SUM。主要有三个选项:1) Pivot Key:在结果集中充当栏位的列...
阅读全文
摘要:这里有篇博客文章是讲这个OLE Command的:http://www.cnblogs.com/tylerdonet/archive/2011/06/20/2085490.htmlOLE Command在《Professional Microsoft SQL Server 2012 Integrat...
阅读全文
摘要:Multicast的中文意思是组播或者多播。那自然这个组件干的事情就是可以把一份数据库输入给多少接收组件作为输入。这里有篇别人的博文讲到了Multicast的主要作用和应用场景:http://www.cnblogs.com/biwork/p/3328838.html。这里引用原文:第一种,从同一个数...
阅读全文
摘要:Wrox的《Professional Microsoft SQL Server 2012 Integration Services》一书中再讲Merge的时候有这样一段解释:This transformation is similar to the Union All Transformation,...
阅读全文
摘要:Merge组件的作用和Union All很相似,就是把两个输入源的结果集合并成一个。但是不同之处在于:1)Merge输入的结果集需要先经过排序(这点表示怀疑)2)Merge对于输入的两个结果集的数据类型有明确是要求,必须是相同,比如A结果集的某个字段是int,那B结果集的对应字段也必须是int。但是...
阅读全文
摘要:这个组件可以实现几个功能,可以选择替换或者生成新的字段传递给下游用。1)中文简体转繁体2)英文字母大小写转换3)字符在半角和全角间转换4)byte字节倒转过来
阅读全文
摘要:这两个transformation的作用是把DT_TEXT, DT_NTEXT, DT_IMAGE类型的数据在文件系统和数据库间导出或者导入。比如把某个数据库表的image类型的字段导出到文件系统成为img文件。做法是在导入导出的时候必须提供完全文件名和路径。需要注意的地方是需要在Import Co...
阅读全文