摘要: Term Lookup是和Term Extraction相反的一个组件。Term Extraction是为了找出term,Term Lookup是利用我们关心的term list来找出某个文本里面包含多少该关键字。 阅读全文
posted @ 2015-05-09 19:57 Jerry_Chen 阅读(129) 评论(0) 推荐(0) 编辑
摘要: 中文意思是关键词抽取,用于计算在文本中哪些词汇或者词组出现的频率最高。其实算法有两张:1)Frequency 2)TFIDFTFIDF的全称是Term Frequency and Inverse Document Frequency,是一个用于计算单词或词组在在整个文本中出现的几率。下面是这个公式的... 阅读全文
posted @ 2015-05-09 18:03 Jerry_Chen 阅读(183) 评论(0) 推荐(0) 编辑
摘要: 这个组件和SQL Server的Pivot基本就是一回事。不过我观察到SSIS的Pivot只支持SUM这种聚合类型,并没有找到哪个选择可以设置聚合类型,而T-SQL语法的Pivot则支持多种聚合类型,包括MAX,MIN,AVG,SUM。主要有三个选项:1) Pivot Key:在结果集中充当栏位的列... 阅读全文
posted @ 2015-05-08 23:26 Jerry_Chen 阅读(182) 评论(0) 推荐(0) 编辑
摘要: 这里有篇博客文章是讲这个OLE Command的:http://www.cnblogs.com/tylerdonet/archive/2011/06/20/2085490.htmlOLE Command在《Professional Microsoft SQL Server 2012 Integrat... 阅读全文
posted @ 2015-05-07 22:54 Jerry_Chen 阅读(142) 评论(0) 推荐(0) 编辑
摘要: Multicast的中文意思是组播或者多播。那自然这个组件干的事情就是可以把一份数据库输入给多少接收组件作为输入。这里有篇别人的博文讲到了Multicast的主要作用和应用场景:http://www.cnblogs.com/biwork/p/3328838.html。这里引用原文:第一种,从同一个数... 阅读全文
posted @ 2015-05-06 23:42 Jerry_Chen 阅读(206) 评论(0) 推荐(0) 编辑
摘要: Wrox的《Professional Microsoft SQL Server 2012 Integration Services》一书中再讲Merge的时候有这样一段解释:This transformation is similar to the Union All Transformation,... 阅读全文
posted @ 2015-05-03 15:53 Jerry_Chen 阅读(220) 评论(0) 推荐(0) 编辑
摘要: Merge组件的作用和Union All很相似,就是把两个输入源的结果集合并成一个。但是不同之处在于:1)Merge输入的结果集需要先经过排序(这点表示怀疑)2)Merge对于输入的两个结果集的数据类型有明确是要求,必须是相同,比如A结果集的某个字段是int,那B结果集的对应字段也必须是int。但是... 阅读全文
posted @ 2015-05-03 01:38 Jerry_Chen 阅读(170) 评论(0) 推荐(0) 编辑
摘要: 这个组件可以实现几个功能,可以选择替换或者生成新的字段传递给下游用。1)中文简体转繁体2)英文字母大小写转换3)字符在半角和全角间转换4)byte字节倒转过来 阅读全文
posted @ 2015-05-03 00:02 Jerry_Chen 阅读(161) 评论(0) 推荐(0) 编辑
摘要: 这两个transformation的作用是把DT_TEXT, DT_NTEXT, DT_IMAGE类型的数据在文件系统和数据库间导出或者导入。比如把某个数据库表的image类型的字段导出到文件系统成为img文件。做法是在导入导出的时候必须提供完全文件名和路径。需要注意的地方是需要在Import Co... 阅读全文
posted @ 2015-05-02 23:55 Jerry_Chen 阅读(263) 评论(0) 推荐(0) 编辑
摘要: Raw File Source & Raw File Destination一般用在当有某个package在导入数据或者处理数据需要花费非常长的时间的情况下,可以通过把一些处理好的数据先存到raw file里面,避免出现遇到错误而需要再重新来过的风险,起码可以去Raw file source里面找到... 阅读全文
posted @ 2015-04-27 00:09 Jerry_Chen 阅读(172) 评论(0) 推荐(0) 编辑