摘要:
... 阅读全文
摘要:
... 阅读全文
摘要:
本文主要讨论CDH集群的YARN调优配置,关于YARN的调优配置,主要关注CPU和内存的调优,其中CPU是指物理CPU个数乘以CPU... 阅读全文
摘要:
历史拉链表是一种数据模型,主要是针对数据仓库设计中表存储数据的方式而定义的。所谓历史拉链表,就是指记录一个事物从开始一直到当前状态的... 阅读全文
摘要:
本文主要介绍 Flink Runtime 的作业执行的核心机制。首先介绍 Flink Runtime 的整体架构以及 Job 的基本... 阅读全文
摘要:
第一题 需求 我们有如下的用户访问数据 userId visitDate visitCount u01 2017/1/21 ... 阅读全文
摘要:
我的博客https://jiamaoxiang.top/ Azkaban是由Linkedin开源的一个批量工作流任务调度器。用于在... 阅读全文