上一页 1 ··· 5 6 7 8 9 10 11 12 下一页
  2020年9月22日
摘要: 内部表和外部表的区别: 未被external修饰的是内部表(managed table),被external修饰的为外部表(external table);区别:内部表数据由Hive自身管理,外部表数据由HDFS管理;内部表数据存储的位置是hive.metastore.warehouse.dir(默 阅读全文
posted @ 2020-09-22 07:39 大鹏的鸿鹄之志 阅读(935) 评论(0) 推荐(0) 编辑
  2020年9月12日
摘要: 1,怎么评价数仓的好坏 2,数仓是怎么组织的?规范是什么? 2,哪个阶段可能会发生shuffle 3,用两个key关联会有几个MR 4,数据倾斜怎么处理的?你是怎么发现的呢? explai查看语句后,里面用的什么算法? 5, 4,删除表发现类似死机现象有什么原因造成的 5,断层排序(实现出排序的效果 阅读全文
posted @ 2020-09-12 08:31 大鹏的鸿鹄之志 阅读(64) 评论(0) 推荐(0) 编辑
  2020年1月11日
摘要: 1,环境配置: a, 安装 java jdk jdk-8u181-windows-x64.exe(http://www.oracle.com/technetwork/java/javase/downloads/index.html) 添加系统环境 b,安装scala scala-2.11.8.zip 阅读全文
posted @ 2020-01-11 16:16 大鹏的鸿鹄之志 阅读(479) 评论(0) 推荐(0) 编辑
  2019年12月28日
摘要: aaa 阅读全文
posted @ 2019-12-28 11:17 大鹏的鸿鹄之志 阅读(110) 评论(0) 推荐(0) 编辑
  2019年12月20日
摘要: canal的作用? 阅读全文
posted @ 2019-12-20 00:46 大鹏的鸿鹄之志 阅读(130) 评论(0) 推荐(0) 编辑
  2019年12月12日
摘要: 数据仓库是面向主题的、集成的、不可更新的、随时间的变化而不断变化的,这些特点决定了数据仓库的系统设计不能采用同开发传统的OLTP数据库一样的设计方法。 数据仓库系统的原始需求不明确,且不断变化与增加,开发者最初不能确切了解到用户的明确而详细的需求,用户所能提供的无非是需求的大的方向以及部分需求, 更 阅读全文
posted @ 2019-12-12 23:50 大鹏的鸿鹄之志 阅读(2213) 评论(0) 推荐(0) 编辑
  2019年12月6日
摘要: MapReduce简介MapReduce是面向大数据并行处理的计算模型、框架和平台,它隐含了以下三层含义: 1)MapReduce是一个基于集群的高性能并行计算平台(Cluster Infrastructure)。它允许用市场上普通的商用服务器构成一个包含数十、数百至数千个节点的分布和并行计算集群。 阅读全文
posted @ 2019-12-06 23:43 大鹏的鸿鹄之志 阅读(10450) 评论(0) 推荐(1) 编辑
  2019年11月26日
摘要: 以下是 Python 内置异常类的层次结构:BaseException+-- SystemExit+-- KeyboardInterrupt+-- GeneratorExit+-- Exception +-- StopIteration +-- ArithmeticError | +-- Float 阅读全文
posted @ 2019-11-26 00:11 大鹏的鸿鹄之志 阅读(275) 评论(0) 推荐(0) 编辑
  2019年11月21日
摘要: 转载:https://blog.csdn.net/WYpersist/article/details/80102778 MapReduce简介MapReduce是面向大数据并行处理的计算模型、框架和平台,它隐含了以下三层含义: 1)MapReduce是一个基于集群的高性能并行计算平台(Cluster 阅读全文
posted @ 2019-11-21 23:45 大鹏的鸿鹄之志 阅读(666) 评论(0) 推荐(0) 编辑
摘要: a a a 阅读全文
posted @ 2019-11-21 21:57 大鹏的鸿鹄之志 阅读(139) 评论(0) 推荐(0) 编辑
上一页 1 ··· 5 6 7 8 9 10 11 12 下一页