摘要:
组件端口及说明 CDH 7180: Cloudera Manager WebUI端口7182: Cloudera Manager Server 与 Agent 通讯端口 Hadoop 50070:HDFS WEB UI端口8020 : 高可用的HDFS RPC端口9000 : 非高可用的HDFS R 阅读全文
摘要:
阅读全文
摘要:
TEXTFILE和SEQUENCEFILE的存储格式都是基于行存储的;并且SEQUENCEFILE是存储为二进制文件 ORC和PARQUET是基于列式存储的。 ORC是列式存储,RC是行式存储 目录 概述 hive文件存储格式包括以下几类 一、TEXTFILE 二、SEQUENCEFILE 三、RC 阅读全文
摘要:
等于切片个数,默认128M一片,无限制,一片一个map() 阅读全文
摘要:
公平调度器:多队列,同一时间队列中多任务按照缺额执行,队列并行度大于队列个数 容量调度器:多队列,同一时间队列中只有一个任务执行,队列中按照先进先出分配任务,队列并行度等于队列个数。 Hadoop2.7.2默认容量调度器 阅读全文