摘要:
阅读全文
摘要:
TEXTFILE和SEQUENCEFILE的存储格式都是基于行存储的;并且SEQUENCEFILE是存储为二进制文件 ORC和PARQUET是基于列式存储的。 ORC是列式存储,RC是行式存储 目录 概述 hive文件存储格式包括以下几类 一、TEXTFILE 二、SEQUENCEFILE 三、RC 阅读全文
摘要:
等于切片个数,默认128M一片,无限制,一片一个map() 阅读全文
摘要:
公平调度器:多队列,同一时间队列中多任务按照缺额执行,队列并行度大于队列个数 容量调度器:多队列,同一时间队列中只有一个任务执行,队列中按照先进先出分配任务,队列并行度等于队列个数。 Hadoop2.7.2默认容量调度器 阅读全文