Introduction of ms PowerPivot for excel (一)
最近在用excel数据透视表的时候,发现一些不足之处。比如2010版的excel支持最大的行数为1048756,而且透视的速度很慢,非常卡。当下一次数据改变的时候(如行变多了或少了)需要重新建立数据透视表,这就非常地麻烦。
无意中发现微软有个插件,叫做PowerPivot for excel ,安装这个插件的好处就是,能够从不同的数据源获取数据(sql server,excel,acess,文本。。。),而且在在效率上也毫不落后,支持上百万行的数据分析,可作为入门级的商业智能(BI)解决方案。
下载地址:http://www.microsoft.com/en-us/download/details.aspx?id=29074
参照微软的官方教程(http://technet.microsoft.com/en-us/library/gg413497.aspx)本文主要包括如下几个方面:
(一)安装初体验
(二)、不同来源的数据的导入
(三)、数据表之间关系的定义
(四)、层次结构定义(hierarchies)
(五)、创建数据透视表和数据透视图
(六)、创建measures和KPI
(七)、创建视图
一)安装初体验
安装时注意需要安装依赖项目,尤其是在xp系统下(excel版本为2010): .NetFramework Platform Update for Windows Vista/Windows Server 2008.
安装完成后,powerpivot就会出现在excel中,若未出现,请在【文件】【选项】【自定义功能区】勾选上PowerPivot即可
好了,安装很简单,下面开始试试PowerPivot的功能。
二)、不同来源的数据的导入
点击PowerPivot选项卡,单击【PowerPivot Window】(上图最左边),进入PowerPivot主界面
主界面与office2003类似,就不做过多介绍
本文的示例数据也是来自于微软的官方示例。http://technet.microsoft.com/en-us/library/gg413497.aspx。请自行下载,主要有以下几个文件
1、从access导入数据,(操作步骤见截图)
选择刚刚下载的示例数据,选择其中的ContosoSales.accdb文件,(access未设置密码则红圈内留空白)
Fridendly cennection name 可以修改为自己熟悉的名字比如Sales DB 等等
点击Next,在这里选择第一项:Select from a list of tables and views to choose the data import(从一些table列表中选择数据导入)
另一项是使用SQL查询语句进行数据导入,适合具有一定sql基础的人使用,灵活方便(下面会具体演示)
在点击Next进入table列表,选择需要的table
这里选择: DimChannel, DimDate, DimProduct, DimProductSubcategory, and FactSales.
注意:每行后边有一列交Friendly Name 自定义table的名称,当然这不会改变数据源里的table名称,
Filter Details是标志你是否对每个表格进行过筛选(比如只取部分列或行)
在这一步,注意到,有时我们只需要一个表的一部分数据,因此可以单击【Preview & Filter】对表格进行筛选.
所以,首先选择DimProduct 表,单击【Preview & Filter】,表中所有列均显示出来,只勾选从 ClassID 到StockTypeName 的15列,确定即可。
此时,在 Filter Details列中会出现一个标志
使用同样的方式对表DimProductSubcategory中进行行筛选,只选择部分行:
去掉对ProductCategoryKey 字段中7,8的选择.则该表只有部分数据出现在最后结果中。点击OK
最后点击完成.可以看到所有导入的表格都已经在PowerPivot中,其管理方式类似于excel。另外也可以看到在FactSales表中,数据记录有200多万条,这在excel中是无法处理的。
先暂时写到这里,后面的主题再慢慢更新。