随笔 - 126  文章 - 0  评论 - 5  阅读 - 94759
09 2020 档案
hadoop namenode的工作机制 (checkpoint过程、元数据合并一个意思)
摘要:转载:1 http://www.cnblogs.com/hanyuanbo/archive/2012/07/25/2608698.html 2 http://blog.csdn.net/u010846741/article/details/52369527 Hadoop 集群中有两种节点,一种是na 阅读全文
posted @ 2020-09-30 11:03 大鹏的鸿鹄之志 阅读(532) 评论(0) 推荐(0) 编辑
面试问题集锦
摘要:一.Hadoop 1.hdfs写流程 2.hdfs读流程 3.hdfs的体系结构 4.一个datanode 宕机,怎么一个流程恢复 5.hadoop 的 namenode 宕机,怎么解决 6.namenode对元数据的管理 7.元数据的checkpoint 8.yarn资源调度流程 9.hadoop 阅读全文
posted @ 2020-09-29 15:06 大鹏的鸿鹄之志 阅读(414) 评论(0) 推荐(0) 编辑
数据治理
摘要:转载: https://mp.weixin.qq.com/s/owrvh4XP0Ip5gE_GXKfulQ 作为一家高度数字化和技术驱动的公司,美团非常重视数据价值的挖掘。在公司日常运行中,通过各种数据分析挖掘手段,为公司发展决策和业务开展提供数据支持。经过多年的发展,美团酒旅内部形成了一套完整的解 阅读全文
posted @ 2020-09-28 11:27 大鹏的鸿鹄之志 阅读(407) 评论(0) 推荐(0) 编辑
阅读
摘要:1,binlog同步数据 2,CRM系统? 阅读全文
posted @ 2020-09-27 16:37 大鹏的鸿鹄之志 阅读(108) 评论(0) 推荐(0) 编辑
hive 数据仓库面试题目集锦
摘要:内部表和外部表的区别: 未被external修饰的是内部表(managed table),被external修饰的为外部表(external table);区别:内部表数据由Hive自身管理,外部表数据由HDFS管理;内部表数据存储的位置是hive.metastore.warehouse.dir(默 阅读全文
posted @ 2020-09-22 07:39 大鹏的鸿鹄之志 阅读(960) 评论(0) 推荐(0) 编辑
面试小问题集锦
摘要:1,怎么评价数仓的好坏 2,数仓是怎么组织的?规范是什么? 2,哪个阶段可能会发生shuffle 3,用两个key关联会有几个MR 4,数据倾斜怎么处理的?你是怎么发现的呢? explai查看语句后,里面用的什么算法? 5, 4,删除表发现类似死机现象有什么原因造成的 5,断层排序(实现出排序的效果 阅读全文
posted @ 2020-09-12 08:31 大鹏的鸿鹄之志 阅读(68) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示