Tableau(数据抽取)

如果启用的是标准的企业数据库,TABLEAU中做实时分析会比较困难,例如以下情况:
(1)不在办公室,无法连接到数据库;
(2)在Microsoft SQL Server或者Oracle,在数据库很大或者数据库设计人员没有做好完整优化的情况下;
(3)访问的数据源不是桌面端数据,而又想保存一个Tableau打包工作薄(.twbx格式文件:该格式文件包含工作薄内部所有底层数据源),就会出错;
以上几种情形需要使用一个“数据提取(扩展名.tde)”数据源,它是Tableau专有文件(里面包含一个紧密压缩、高速的数据文件,Tableau将其存储在计算机内存中,一般是的是硬盘,底层数据在用到的时候才会进入内存),包含从另一个数据库或者是数据源中导入的所有内容;

连接到某些数据源(例如Salesforce和Google Analytics)是会自动创建数据提取,基于网络的数据源在本地交互,速度可能会比较慢,另外,频繁地与这些网络数据交互可能会超过其供应商给用户设置的服务限制。
创建一个数据提取的首次机会是在最开始连接到数据源时,指明必要的数据源属性后,弹出对话框提示用户是要选择一个实时连接还是创建一个数据提取,可以选择“导入所有数据”来创建一个完整的数据提取,该数据提取包含底层数据源中的所有字段和行;或者选择“导入部分数据”,以显示“创建数据提取”对话框,从中可以设置将用户数据提取限定为底层数据源的一个有限数据集。Tableau一秒钟可以刷新100MM条记录。

posted @ 2015-09-15 16:12  rosewong  阅读(6393)  评论(0编辑  收藏  举报