摘要:最近在优化公司的数据仓库项目中ETL部分,发现有一处明显可以改进的地方,发出来和大家分享一下。在数据仓库中一个一个超级大维度表(1亿左右的记录),更新这个维度表的时候,采取的策略是最简单的1类渐变维度,即存在则更新,不存在则插入。原先的方式是在ETL过程中先查找这个大表本身,如果存在就打上update标记,不存在就打上insert标记,最后通过分支来分别插入和更新数据记录。每次执行这个job的时候...
阅读全文
摘要:给大家推荐一款不错的开源web分析工具piwik。它的官网地址是http://www.piwik.org它的在线演示地址是http://demo.piwik.org/最近由于工作需要评估了一些web分析工具,其中当然缺少不了大名鼎鼎的Google Analytics,还有其他的百度统计和量子统计,另外还有几款开源的软件Open Web Analytics,piwik等。从功能面和易用性方面,当然G...
阅读全文
摘要:我们有时候需要针对cognos做一些二次开发,开发过程那么就当然需要调试,我本人不是做java的程序员,所以摸索出cognos的调试还是费了些时间,以下我准备把我的经验和刚做cognos二次开发的朋友做个分享。以下是我在开发cognos自定义验证插件时的过程:1.在eclipse中创建项目,写好代码,编译;2.编译完成后参照cognos自定义验证配置文档把编译后的jar文件和数据库配置文件拷贝到指...
阅读全文