摘要:
第16讲:轻量级日志收集工具 Filebeat 应用案例 高俊峰(南非蚂蚁) ###Filebeat 简介 Filebeat 是一个开源的文本日志收集器,Elastic 公司 Beats 数据采集产品的一个子产品,采用 Go 语言开发。一般安装在业务服务器上作为代理来监测日志目录或特定的日志文件,并 阅读全文
摘要:
第15讲:Flink Standalone、Flink on Yarn 集群构建与应用场景 高俊峰(南非蚂蚁) 本课时主要讲解“Flink 独立集群模式与 Flink on Yarn 模式应用实战”。 ###Flink 概念及架构介绍 Flink 是一个高性能、高吞吐、低延迟的流处理框架,用于在无边 阅读全文
摘要:
第14讲:HBase 与 Hadoop 的整合应用实践 高俊峰(南非蚂蚁) ###Spark 与 Yarn 的整合过程 Spark 独立模式下集群资源配置比较灵活,但是当用户较多时,资源调度无法控制,则会出现资源争抢的情况。此时可以考虑使用 Yarn 的资源调度,也就是将 Spark 整合到 Yar 阅读全文
摘要:
第13讲:Spark Standalone 模式的构建以及 Spark 与 Yarn 的整合 高俊峰(南非蚂蚁) ###安装部署独立模式的 Spark Spark 现在已经广泛使用在各个企业中,常见的应用模式有两种,分别是独立集群模式,以及与 Yarn 整合使用模式,下面分别介绍这两种模式的使用。 阅读全文
摘要:
第12讲:Hadoop 分布式资源管理器 Yarn、MR 运行机制剖析 高俊峰(南非蚂蚁) 本课时主要剖析 Hadoop 分布式资源管理器 Yarn 和 MR 运行机制。 ###Yarn 的整体架构 Yarn 是 Hadoop2.x 版本提出的一种全新的资源管理架构,此架构不仅支持 MapReduc 阅读全文
摘要:
第11讲:HDFS 组件运行机制剖析及 HDFS Shell 的使用 高俊峰(南非蚂蚁) ###HDFS 的基本架构 Hadoop 中的分布式文件系统 HDFS 为大数据平台提供了统一的存储,它主要由三部分构成,分别是 NameNode、DataNode 和 SecondaryNameNode。如果 阅读全文