摘要: 一、相关分析 通常当聚合率和数据量没有大于一定程度时,对于不涉及Rollup、Cube、Grouping_Sets这三种操作的聚合很少出现GC问题。对于Rollup、Cube、Grouping_Sets操作可采用如下优化方法避免GC。 1、Rollup / Cube / Grouping_Sets时 阅读全文
posted @ 2019-03-07 17:53 xiaolaotou 阅读(1153) 评论(0) 推荐(0) 编辑
摘要: 一、Yarn架构 Yarn架构设计也是主从架构,分为Resource Manager(RM)和Node Manager(NM),其中RM主要负责应用管理和资源调度,NM主要负责容器和作业。 1、Yarn架构介绍 ResourceManager(RM): 负责对各个Node Manager(NM)上的 阅读全文
posted @ 2019-03-07 17:30 xiaolaotou 阅读(1585) 评论(0) 推荐(0) 编辑
摘要: 一、 简单了解NameNode的ZKFC机制 NameNode的HA可以个人认为简单分为共享editLog机制和ZKFC对NameNode状态的控制 一般导致NameNode切换的原因 ZKFC的作用是什么?如何判断一个NN是否健康 一般导致NameNode切换的原因 ZKFC的作用是什么?如何判断 阅读全文
posted @ 2019-03-07 14:55 xiaolaotou 阅读(4976) 评论(0) 推荐(2) 编辑
摘要: Elasticsearch是基于Json的分布式搜索和分析引擎,是利用倒排索引实现的全文索引。 优势: 横向可扩展性:增加服务器可直接配置在集群中 分片机制提供更好的分布性:分而治之的方式来提升处理效率 高可用:提供复制(replia)机制 实时性:通过将磁盘上的文件放入文件缓存系统来提高查询速度 阅读全文
posted @ 2019-03-07 10:59 xiaolaotou 阅读(611) 评论(0) 推荐(0) 编辑
摘要: 转载:http://www.cnblogs.com/nexiyi/p/hbase_config_94.html 版本:0.94-cdh4.2.1 hbase-site.xml配置 hbase.tmp.dir 本地文件系统tmp目录,一般配置成local模式的设置一下,但是最好还是需要设置一下,因为很 阅读全文
posted @ 2019-03-07 10:00 xiaolaotou 阅读(592) 评论(0) 推荐(0) 编辑