heartstill

博客园 首页 新随笔 联系 订阅 管理

2010年12月8日 #

摘要: 数据仓库产品介绍  目前市场上各种数据仓库产品及其解决方案品种繁多,产品定位不同,各有特点,究竞选择哪家的产品能更适合自己的企业特点与未来发展?  目前市场上除了Microsoft之外的另外八大主流数据仓库产品是:BusinessObjects、Oracle、IBM、Sybase、Informix、NCR、SAS、CA,下面对其进行一一介绍。1.4.1BusinessObjects1.产品特点  BusinessObjects是一个集查询、报表和OLAP技术为一身的智能决策支持系统。它使用独特的“语义层”技术和“动态微立方”技术来表示数据库中的多维数据,具有较好的查询和报表功能,提供钻取(Dr 阅读全文
posted @ 2010-12-08 15:32 开始测试 阅读(613) 评论(0) 推荐(0) 编辑

摘要: 我主要用rysnc同步文件,rsync是一款非常优秀的文件同步管理软件,它也支持多种操作系统平台,在Unix环境中,rsync有着卓绝的功绩。希望这篇文档能对一些朋友有所帮助。1. Installhttp://www.samba.org/rsync/shell tar zxvf rsync-x.x.x.tar.gzshell cd rsync-x.x.xshell ./configure && make && make install目前大部分 Unix/Linux 默认即安装了 rsync。2. /etc/rsyncd.confshell touch /etc/rsyncd.conf 阅读全文
posted @ 2010-12-08 14:05 开始测试 阅读(629) 评论(0) 推荐(0) 编辑

摘要: DRBD 是由内核模块和相关脚本而构成,用以构建高可用性的集群。其实现方式是通过网络来镜像整个设备。您可以把它看作是一种网络RAID。DRBD负责接收数据,把数据写到本地磁盘,然后发送给另一个主机。另一个主机再将数据存到自己的磁盘中。其他所需的组件有集群成员服 务,如TurboHA 或 心跳连接,以及一些能在块设备上运行的应用程序。例如:裸I/O、文件系统及fsck、具有恢复能力的数据库。下面是DRBD的系统结构图 阅读全文
posted @ 2010-12-08 14:03 开始测试 阅读(249) 评论(0) 推荐(0) 编辑

摘要: 数据仓库数据的多粒度化为用户使用数据提供了一定的灵活性,例如家用电器销售数据可以同时满足市场、财务和销售等部门的需要,财务部若要了解某地区的销售收入,只需改变相关数据的粒度即可。ETL数据仓库并不只是数据的简单累积,而是经过一系列的抽取、转换和装载的过程,简称ETL。ETL是构建数据仓库的重要环节,对数据仓库的后续环节影响比较大。目前市场上主流的ETL工具有Informatica公司的PowerCenter、IBM公司的DataStage、Oracle公司的WarehouseBuilder以及Microsoft公司的SQLServerIS等。下面简要介绍ETL的主要功能。  1.数据抽取  数 阅读全文
posted @ 2010-12-08 11:59 开始测试 阅读(495) 评论(0) 推荐(0) 编辑

摘要: ETL是商业智能(BI)的重要组成部分。我们先看一下在WIKI中的定义:ETL,是英文Extract-Transform-Load的缩写,即填充、更新数据仓库的数据抽取、转换、装载的过程。这是实现商业智能之前的数据采集步骤。这一步骤完成之后,对库中数据的数据挖掘、分析处理才可以进行。对于ETL而言,“是什么”是很容易理解的,也就是将分散的、不易利用的数据进行整理,变成规则清晰的、易于利用的、(可能同时还是)集中的数据。在ETL过程之外,就可以基于报表分析系统、多维分析系统和数据挖掘系统等,进行进一步的数据分析利用。这一过程可以通过Hard Codding,即编写程序实现,也可以通过各种ETL工 阅读全文
posted @ 2010-12-08 11:36 开始测试 阅读(431) 评论(0) 推荐(0) 编辑