摘要:
public static String dealDateFormat(String oldDate) { Date date1 = null; DateFormat df2 = null; try { DateFormat df = new SimpleDateFormat("yyyy-MM-dd 阅读全文
摘要:
Collections.sort(list<T>, Comparator.comparing(T::getTime, (t1, t2) -> t2.compareTo(t1))); 阅读全文
摘要:
因为spark默认的元数据存储在derby,derby是单session的,启动多个会报错,杀掉多余进程解决。 阅读全文
摘要:
1.读写流程 2.默认块大小 集群模式:128m 本地模式:32m hadoop1.x:64m 业务开发:128m 256m hive的文件块:256m 3.小文件 namenode 内存128g 一个文件块占用namenode 150字节 128*1024*1024*1024字节/150字节=9亿 阅读全文
摘要:
ERROR hdfs.HDFSEventSink: process failed java.lang.OutOfMemoryError: GC overhead limit exceeded。 flume配置的内存不足,报了了OOM。 解决方法:在/flume/conf/flume-env.sh文件 阅读全文
摘要:
使用flume将数据写到HDFS上,出现大量的不到1kb的小文件。 危害:占用NameNode内存 n*150字节 (采用har归档:hadoop archive -archiveName **.har -p /输入路径 /输出路径) 增加切片个数 n个maptask 产生原因: hdfs.roll 阅读全文