Business Intelligence (BI)

  BI, 全称Business Inteligence。 帮助企业更有效地利用数据,提供经营决策支持。让决策管理者随时随地获取关键信息,基于数字决策,最终提高决策水平。 

  包括范围(层次由低到高):数据报表(传统数据报表,心数据报表)、OLAP(在线链接分析)、数据挖掘。是数据仓库、OLAP和数据挖掘技术的综合应用。

BI solution:

DB—>ETL—>Data Warehouse—>Data Mining|OLAP —>DataAnalyzing|DataReporting

—>BI portal

  ETL:Extract, Transfer, Local

  数据仓库是一个独立的数据环境,需要通过抽取过程(ETL)将数据从OLTP(联机事物处理)环境,外部数据源和脱机的数据存储介质导入到数据仓库。

  ETL是负责将分布的异构数据源中的数据(如关系数据、平面数据文件等)抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据即使中,成为OLAP、数据挖掘的基础。

  抽取:异构数据源; 转换:过滤数据,按照既定规则处理不一致的数据;加载:写入数据仓库或数据集市。

 

  SSIS(Microsoft SQL Server Integration Services), 声称高性能解决方案(包括数据仓库的ETL)的平台, 可视化编程环境,无需编码。

 

  CDC :Change Data Capture

  对数据更新进行监控,捕获业务数据表的更新,实现数据仓库的增量更新。

  solution:1.在数据表中加入特殊标识列。

       2.在数据表上创建触发器。

       3.SQL Server change data capture: 关系型数据库,所有数据操作都会在日志中记录,通过分析日志就能够获得完整的数据操作历史。

  OLAP & Cube(核心)

  OLAP:(Online Analytical Processing):使分析人员、管理人员或执行人员能从多角度对从原始数据中转换出来的,能够真正被用户所理解的,并真实反映企业多维特性的信息进行快速、一致、交互地存储,从而获得对数据更深入了解的一类软件技术。

  Cube可以理解为一种多维数据库。

  维度(Dimension):观察数据的特定角度,如时间、地理等。

      维的层次(Level):某个角度不同细节的描述。

     维的成员(Member): 维的取值。

  度量值(Measure):观察的对象、数值。 如销售额,销售量等。

posted @ 2014-10-28 21:30  Jacob_乔  阅读(358)  评论(0编辑  收藏  举报