文章分类 -  SSIS

摘要:编辑器加载中...SSIS就是微软在SQL SERVER2005上对DTS的升级,不得不说,微软在BI上是花了很大功夫的,包括提供了SSIS,SSAS,SSRS等多个工具,从创建数据仓库,到从元数据抽取数据,到创建维度和挖掘结构,挖掘模型,训练,报表模型设计,报表设计,发布,非常方便和强大。先从ETL开始,看看利用这些工具如何将元数据和数据仓库联系起来,以下转自MSDN: 在本课中,您将创建一个简单 ETL 包,该包可以从单个平面文件源提取数据,使用两个查找转换组件转换该数据,然后将该数据写入 AdventureWorksDW 中的 FactCurrencyRate 事... 阅读全文
posted @ 2012-03-15 17:12 ^_^肥仔John 阅读(1531) 评论(0) 推荐(0)
摘要:对于MS SQL-Server的DTS,在使用MS SQL-Server2000时,有最基本的接触,但仅限时简单的数据导入/导出。当开始了解ETL时,才发现DTS原来就是ETL的应用之一。 先不谈论DTS的好坏,但它至少MS产品的特点,易学,易用。所以,要了解ETL的应用,从DTS开始,在我看来,是个不错的选择。我只是学习,所以我没有能耐去评价它,下面,只能讲DTS的功能一一列举出来,可能这些与SQL-Server的联机帮助有些重复,但对我来说,是一个加深记忆的方法。 一:概念 自完全不同源的数据析取、转换并合并到单个或多个目的。主要应用于企业数据仓库的数据抽取过程,完成从源数据库/文件到.. 阅读全文
posted @ 2012-03-15 17:03 ^_^肥仔John 阅读(562) 评论(0) 推荐(0)
摘要:ETL为数据仓库服务,数据仓库用于数据分析,数据分析属于BI系统的要干的事儿。 一般中/小型ERP系统都会有不成熟的BI系统,为啥叫做不成熟? 因为它们或者有报表分析功能,但不具有OLAP(在线分析),或者有OLAP,但却没有数据挖掘和深度分析。或者干脆,来个大集成,直接利用第三方工具来达到相应的目的。 为什么会这样,究其原因,很多情况是因为没有自主的数据仓库,没有数据仓库,其它的做起来也就有些四不象了。而要建立数据仓库,首要的是:ETL。 于是,需求就应运而生了。 对了,BI是什么?OLAP是啥?什么又是数据挖掘?鉴于我只能解释其表面含义,我就不多说了。各位不妨找本数据仓库的书,翻翻前... 阅读全文
posted @ 2012-03-15 16:52 ^_^肥仔John 阅读(575) 评论(0) 推荐(0)
摘要:ETL有时候显得很神秘,其实大部分项目都有用到,只要有报表展示,就是一个ETL过程。 首先,我们来了解最基本的定义: 嗯,也有人将ETL简单称为数据抽取。至少在未学习之前,领导告诉我的是,你需要做一个数据抽取的工具。 其实呢,抽取是ETL中的关键环节,顾名思义,也就将数据从不同的数据源中抓取(复制)出来。 太简单了! 上面的解释无首无尾,有点象能让你吃饱的第七个烧饼, 仔细一想,抽取是不可能单独存在,我们需要将与之关联的一些其它环节拿出来。 于是,得到ETL的定义: 将数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。 好... 阅读全文
posted @ 2012-03-15 16:27 ^_^肥仔John 阅读(881) 评论(0) 推荐(0)
摘要:微软将数据流技术称为管道(Pipeline)技术,数据流组件也可以叫做管道组件。可以形象地将数据看成水流在管道中流动,每个数据流组件接收上游组件交付的数据,将数据处理后再交付给下游的组件。组件元数据可以通过右击一个组件,选择”显示高级编辑器”来查看组件的元数据。不是所以的组件都可以显示高级编辑器,而且很多组件,即使在高级编辑器中,我们也无法任意修改预定的元数据。比如在组件中加入或删除输出。关于保护元数据,会在实现组件设计时方法中提到。输入和输出是组件最基本的元数据,每个组件都可以若干个输出和输入,输入用来接收上游组件输出的数据,组件对数据处理完成后,输出将数据交给下游组件。源组件只有输出,目标 阅读全文
posted @ 2012-03-12 17:59 ^_^肥仔John 阅读(712) 评论(0) 推荐(0)
摘要:4. 研究一个控制流示例图12-2显示了一个简单的控制流示例。它以FTP任务开始,该FTP任务用于下载已压缩的数据文件。一旦下载完这些文件,运行时就会到达Foreach循环容器,在该容器内部有两个任务:执行进程任务(该任务调用unzip应用程序来解压缩数据文件)和大容量插入任务(该任务将数据文件的数据插入到SQL Server中)。当解压缩完数据文件并且将数据文件的数据加载到SQL Server中时,循环会停止。如果在循环期间发生了错误,则该控制流将执行发送邮件任务:向DBA发送电子邮件。如果正确地执行了每个任务,则该控制流将执行SQL任务:在新的数据集上创建一些视图。断点是在执行SQL任务的 阅读全文
posted @ 2012-03-12 14:30 ^_^肥仔John 阅读(1348) 评论(1) 推荐(0)
摘要:12.1 SSIS介绍SSIS首先是在1997年的SQL Server 7.0中引入的,当时它的名称为数据转换服务(DTS)。SSIS属于ETL产品家族,ETL代表提取(Extraction)、转换(Transformation)和加载(Loading)。现在,越来越多的企业都有数据仓库。ETL是将来自OLTP数据库的数据定期加载到数据仓库中必不可少的工具。在SQL Server的前两个版本—— SQL Server 7.0和SQL Server 2000中,SSIS主要集中于提取和加载。通过使用SSIS,可以从任何数据源中提取数据以及将数据加载到任何数据源中。在SQL Server 2005 阅读全文
posted @ 2012-03-12 13:26 ^_^肥仔John 阅读(5083) 评论(0) 推荐(0)