友情链接: 互动百科 CSDN.NET 百度音乐 和讯理财 世界杯吧 拉手网

简述数据仓库、OLAP、数据挖掘之间的关系

1)数据仓库是基础:无论是数据挖掘还是OLAP分析,他们成功的关键之一是能够访问正确的、完整的和集成的数据。这也是对数据仓库的要求。数据仓库不仅是集成数据的一种方式和一个焦点,而且所有的数据仓库的解决方案都源自和依赖于数据源部件的质量和效果(这种部件在数据仓库中称为抽取、变换和装载)。数据仓库的特点(集成的、随时间变化、稳定的、面向主题的)为OLAP分析、数据挖掘的成功提供了坚实的数据基础。

2OLAP和数据挖掘的区别:OLAP与数据挖掘都是数据库或数据仓库的分析工具,是相辅相成,都是决策分析不可缺少的工具。但他们又有不同,OLAP是验证型的分析工具,而数据挖掘是预测型的工具。 OLAP建立在多维视图的基础之上,强调执行效率和对用户命令的及时响应,而且其直接数据源一般是数据仓库;数据挖掘建立在各种数据源的基础上,能够自动分析发现隐藏在数据深层次的对人们有用的模式(Patterns),一般并不过多考虑执行效率和响应速度。

OLAP是一种自上而下、不断深入的分析工具;用户提出问题或假设,通过OLAP从上而下地提取出关于该问题地详细信息,并且以可视化的方式呈现给用户。与数据挖掘相比,OLAP更多地依靠用户提供的问题和假设,受用户的思维习惯所影响。

数据挖掘常能挖掘出超越归纳范围的关系,但OLAP仅能利用人工查询及可视化的报表来确认某些关系,是以数据挖掘此种自动找出甚至不会被怀疑过的数据关系的特性,事实上己超越了我们经验、教育、想象力的限制,OLAP可以和数据挖掘互补,但这项特性是数据挖掘无法被OLAP取代的。

3)数据挖掘与数据仓库的关系:尽管数据挖掘技术扎根于计算科学和数学,但两者的结合能给数据挖掘带来各种便利和功能。

首先,数据挖掘有一个昂贵的数据清理、数据变换和数据集成的过程,作为数据的预处理。而已经完成数据清理、数据变换和数据集成的数据仓库,完全能为数据挖掘提供它所需要的挖掘数据。

其次,数据仓库能为数据挖掘提供各种数据库连接、WEB访问和服务工具以及报表与OLAP分析工具等全面的数据处理和数据分析等基础设施。

最后,在数据挖掘工程中,如果将数据挖掘与数据仓库进行有效的联结,将增加数据挖掘的联机挖掘功能。

posted on 2010-09-15 15:36  行万里路 责任 创新 执着  阅读(1248)  评论(0编辑  收藏  举报