jpSpaceX - 博客园

2021年7月27日

摘要：第28讲：Hadoop 平台常见故障汇总以及操作系统性能调优高俊峰（南非蚂蚁） ###Hadoop 日常运维问题及其解决方法 ####1.如何下线一个 datanode 节点? 当一个 datanode 节点所在的服务器故障或者将要退役时，你需要在 Hadoop 中下线这个节点，下线一个 data 阅读全文

posted @ 2021-07-27 19:43 jpSpaceX 阅读(2511) 评论(0) 推荐(1)

[大数据运维]第27讲：Yarn、HDFS、Kafka 内存调优策略以及性能瓶颈

摘要：第27讲：Yarn、HDFS、Kafka 内存调优策略以及性能瓶颈高俊峰（南非蚂蚁） Hadoop 性能调优是一项复杂烦琐、难度极大的工作，不仅要求对 Hadoop 本身有深刻理解，还涉及底层硬件、网络、操作系统、Java 虚拟机等方面的调优工作。 Hadoop 性能调优，不仅靠运维，还需开发人员阅读全文

posted @ 2021-07-27 19:16 jpSpaceX 阅读(1306) 评论(0) 推荐(0)

2021年7月26日

[大数据运维]第26讲：HDFS 存储权限 ACL 控制策略以及与系统权限整合应用

摘要：第26讲：HDFS 存储权限 ACL 控制策略以及与系统权限整合应用高俊峰（南非蚂蚁） ###POSIX 系统权限模型 POSIX 系统权限模型是 Linux/Unix 下的一个权限定义标准，此标准规定了每个文件和目录有一个所有者（Owner）和一个组（Group）。文件和目录可以通过权限区阅读全文

posted @ 2021-07-26 23:35 jpSpaceX 阅读(946) 评论(0) 推荐(0)

2021年7月23日

[大数据运维]第25讲：Yarn 资源调度 Fair Schedule 与 Capacity Scheduler 配置选型

摘要：第25讲：Yarn 资源调度 Fair Schedule 与 Capacity Scheduler 配置选型高俊峰（南非蚂蚁）在大数据平台运维中，会经常遇到集群资源争抢的问题。因为在公司内部，Hadoop Yarn 集群一般会被多个业务、多个用户同时使用，共享 Yarn 资源。此时，如果不对集群阅读全文

posted @ 2021-07-23 18:42 jpSpaceX 阅读(1240) 评论(0) 推荐(0)

[大数据运维]第24讲：通过 Kafka Eagle 实现对 Kafka 消息队列的监控

摘要：第24讲：通过 Kafka Eagle 实现对 Kafka 消息队列的监控高俊峰（南非蚂蚁）在企业实际应用中，如果业务比较复杂，那么管理的 Consumer Group 和 Topic 数也会随之增加，此时如果再使用 Kafka 提供的命令行工具，可能会出现力不从心的感觉。因此，我们需要一款更阅读全文

posted @ 2021-07-23 18:18 jpSpaceX 阅读(1188) 评论(0) 推荐(0)

[大数据运维]第23讲：Namenode、Datanode、Nodemanager 等服务状态监控策略

摘要：第23讲：Namenode、Datanode、Nodemanager 等服务状态监控策略高俊峰（南非蚂蚁） ###Centreon 介绍与安装 Centreon 是一款功能强大的分布式 IT 监控系统，通过第三方组件可以实现对网络、操作系统和应用程序的监控：首先，它是开源的，你可以免费使用它；阅读全文

posted @ 2021-07-23 17:49 jpSpaceX 阅读(838) 评论(0) 推荐(0)

2021年7月22日

[大数据运维]第22讲：通过 Ganglia 实现对 HDFS、Yarn、Spark 运行状态监控

摘要：第22讲：通过 Ganglia 实现对 HDFS、Yarn、Spark 运行状态监控高俊峰（南非蚂蚁） ###Ganglia 概念与架构 ####1. Ganglia 介绍说起 Ganglia，可能大家有些陌生，但是如果提起大数据平台监控工具，那么第一个想到的就是 Ganglia。因为 Gang 阅读全文

posted @ 2021-07-22 17:47 jpSpaceX 阅读(782) 评论(0) 推荐(0)

[大数据运维]第21讲：Filebeat+Kafka+Logstash+Elasticsearch 构建可视化日志分析系统

摘要：第21讲：Filebeat+Kafka+Logstash+Elasticsearch 构建可视化日志分析系统高俊峰（南非蚂蚁） ###典型 ELK 应用架构下图是本课时即将要介绍的一个线上真实案例的架构图：某个线上案例图此架构稍微有些复杂，这里解读一下架构图，该图从左到右，总共分为 5 层，阅读全文

posted @ 2021-07-22 16:38 jpSpaceX 阅读(924) 评论(0) 推荐(0)

2021年7月21日

[大数据运维]第20讲：日均数据量 30 亿的 Filebeat+Kafka+Mirrormaker 跨机房实时日志传送案例

摘要：第20讲：日均数据量 30 亿的 Filebeat+Kafka+Mirrormaker 跨机房实时日志传送案例高俊峰（南非蚂蚁） ###案例环境介绍这是我们之前的一个应用案例，先说一下业务场景，这是一款电商 App 产品，此 App 运行在某公有云上，每天都会产生大量日志，其中涉及访问日志、购买阅读全文

posted @ 2021-07-21 16:11 jpSpaceX 阅读(870) 评论(0) 推荐(0)

[大数据运维]第19讲：Kafka 应用场景、集群容量规划、架构设计应用案例

摘要：第19讲：Kafka 应用场景、集群容量规划、架构设计应用案例高俊峰（南非蚂蚁） ###Kafka 基础与入门 ####1. Kafka 基本概念 Kafka 官方的定义：是一种高吞吐量的分布式发布/订阅消息系统。这样说起来可能不太好理解，这里简单举个例子：现在是个大数据时代，各种商业、社交、搜索阅读全文

posted @ 2021-07-21 15:47 jpSpaceX 阅读(633) 评论(0) 推荐(0)

2021年7月20日

[大数据运维]第18讲：Elasticsearch 应用架构的实现与调优

摘要：第18讲：Elasticsearch 应用架构的实现与调优高俊峰（南非蚂蚁） ###Elasticsearch 介绍 Elasticsearch 是一个实时的分布式搜索和分析引擎，它可以用于全文搜索、结构化搜索及分析，并采用 Java 语言编写，它的主要特点如下：实时搜索、实时分析；分布式架构阅读全文

posted @ 2021-07-20 19:58 jpSpaceX 阅读(206) 评论(0) 推荐(0)

[大数据运维]第17讲：日志收集、分析过滤工具 Logstash 应用实战

摘要：第17讲：日志收集、分析过滤工具 Logstash 应用实战高俊峰（南非蚂蚁）本课时主要讲解“日志收集、分析过滤工具 Logstash 应用实战”。 ###Logstash 介绍与安装 Logstash 是一款轻量级的、开源的日志收集处理框架，它可以方便地把分散的、多样化的日志搜集起来，并进行自阅读全文

posted @ 2021-07-20 19:28 jpSpaceX 阅读(538) 评论(0) 推荐(0)

2021年7月19日

[大数据运维]第16讲：轻量级日志收集工具 Filebeat 应用案例

摘要：第16讲：轻量级日志收集工具 Filebeat 应用案例高俊峰（南非蚂蚁） ###Filebeat 简介 Filebeat 是一个开源的文本日志收集器，Elastic 公司 Beats 数据采集产品的一个子产品，采用 Go 语言开发。一般安装在业务服务器上作为代理来监测日志目录或特定的日志文件，并阅读全文

posted @ 2021-07-19 18:16 jpSpaceX 阅读(464) 评论(0) 推荐(0)

[大数据运维]第15讲：Flink Standalone、Flink on Yarn 集群构建与应用场景

摘要：第15讲：Flink Standalone、Flink on Yarn 集群构建与应用场景高俊峰（南非蚂蚁）本课时主要讲解“Flink 独立集群模式与 Flink on Yarn 模式应用实战”。 ###Flink 概念及架构介绍 Flink 是一个高性能、高吞吐、低延迟的流处理框架，用于在无边阅读全文

posted @ 2021-07-19 17:54 jpSpaceX 阅读(778) 评论(0) 推荐(0)

[大数据运维]第14讲：HBase 与 Hadoop 的整合应用实践

摘要：第14讲：HBase 与 Hadoop 的整合应用实践高俊峰（南非蚂蚁） ###Spark 与 Yarn 的整合过程 Spark 独立模式下集群资源配置比较灵活，但是当用户较多时，资源调度无法控制，则会出现资源争抢的情况。此时可以考虑使用 Yarn 的资源调度，也就是将 Spark 整合到 Yar 阅读全文

posted @ 2021-07-19 17:31 jpSpaceX 阅读(470) 评论(0) 推荐(0)

若水三千

只为娶你一瓢饮！

公告