摘要: 面试曾经 问这个问题 答案贴出来。 我写一下使用心得 1。不管是哪种类型。数据来源是哪种类型,数据仓库 尽量是用这些类型。 2. 数据仓库是数据存储的地方,如果把雪花模型改成星型默认容易丢失数据。 3.主题 应该采用 雪花模型。 4.报表展示 采用 星型模型。 5.根据实际情况 修改。你更愿意 空间 阅读全文
posted @ 2017-01-16 14:40 超超hd 阅读(757) 评论(0) 推荐(0) 编辑
摘要: 数据仓库包含标准化数据。 还包含 外部数据/非结构化数据 如果外部数据 量小 可以保持数据库内部或者专用服务器。 如果量大 只能记住地址, 在etl 加载 当然也有需求 是实时数据 比如股票 汇率 拿只能etl过程处理 非结构化数据 包含图片 ,视频 音频 如果是传统数据库 db2 oracle存在 阅读全文
posted @ 2017-01-16 14:11 超超hd 阅读(2486) 评论(0) 推荐(0) 编辑
摘要: 安装 hive后 在命令行 如输入 Hive -h -后面随便输入。让让他报错进入命令提示界面 -d 定义一个变量 两种形式 -d A=B or --define A=B -e 执行sql语句 hive -e "select * from a" -f 执行一个sql片段。或者包含sql语句的文本文件 阅读全文
posted @ 2017-01-16 10:21 超超hd 阅读(2045) 评论(0) 推荐(0) 编辑
摘要: 664行 CliDriver main启动 public static void main(String[] args) throws Exception { int ret = new CliDriver().run(args); System.exit(ret); } 646行 public i 阅读全文
posted @ 2017-01-16 09:45 超超hd 阅读(692) 评论(0) 推荐(0) 编辑