2015年2月19日

Oracle 性能维护一点

摘要: 大数据量表的维护原则 1.如果此表经常CRUD,最好的办法是定期收集统计信息传递给oracle优化器,提高性能。例如dbms_stats.gather_table_stats命令。 可以做在ETL中,定期执行。 2.考虑使用业务常用字段来进行分区,例如时间或地域等。以提高表查询的效率。 视图创建原则 1.绝对禁止在视图的基础上再创建视图,为什么这样会影响性能? ... 阅读全文

posted @ 2015-02-19 10:11 tneduts 阅读(134) 评论(0) 推荐(0) 编辑

DW与DM

摘要: DW组成部分简介 DW的组成部分有:针对数据源的分析、数据的ETL、数据的存储结构,元数据管理等。 数据源分析 主要是分析要抽取哪些数据,如何抽取(全量还是增量)?它的更新周期是怎么样的?它的数据质量如何? 确定数据的格式,数据的域。 ETL ETL之前需要知道以下内容,数据源有哪些系统,各个业务系统的RDBMS是什么?是否存在手工维护的数据? 数据抽取... 阅读全文

posted @ 2015-02-19 09:57 tneduts 阅读(1254) 评论(0) 推荐(0) 编辑

WordCount Analysis

摘要: 1.Create a new java project, then copy examples folder from /home/hadoop/hadoop-1.0.4/src; Create a new folder named src, then Paste to the project to this folder. Error: Could not find or load main... 阅读全文

posted @ 2015-02-19 00:30 tneduts 阅读(360) 评论(0) 推荐(0) 编辑

导航