linhaifeng - 博客园

2022年3月3日

摘要： spark01 主 10.61.187.24 spark02 从 10.61.187.20 vip: 10.61.187.51 在spark01与spark02部署 yum -y install haproxy keepalived -y # yum源已配置过了，此处直接安装即可在spark01与阅读全文

posted @ 2022-03-03 14:24 linhaifeng 阅读(155) 评论(0) 推荐(0) 编辑

keepalived两台机器同时出现vip问题

摘要：配置文件：主：192.168.1.14keepalived.conf ! Configuration File for keepalived global_defs { script_user root enable_script_security } vrrp_script check_ngin 阅读全文

posted @ 2022-03-03 13:53 linhaifeng 阅读(979) 评论(0) 推荐(0) 编辑

2022年3月2日

Redis-Cluster集群

摘要：本文参考:Redis Cluster集群的搭建与实践 redis最开始使用主从模式做集群，若master宕机需要手动切换slave为master；于是有了哨兵模式，该模式下有一个哨兵监视master和slave，若master宕机可自动将slave转为master，但它也有一个问题，就是不能动态扩充阅读全文

posted @ 2022-03-02 11:11 linhaifeng 阅读(2088) 评论(0) 推荐(0) 编辑

2022年2月24日

Zookeeper完全分布式集群的搭建

摘要：一、集群模式 1、单机模式在zoo.cfg中只配置一个server.id就是单机模式了。这种模式下，如果当前主机宕机，那么所有依赖于当前zookeeper服务工作的其他服务器都不能在进行正常工作，这种事件称为单节点故障。所以这种模式一般用在测试环境。 2、伪分布式在zoo.cfg中配置多个se 阅读全文

posted @ 2022-02-24 16:07 linhaifeng 阅读(1150) 评论(0) 推荐(0) 编辑

2022年2月23日

Hadoop、Spark——完全分布式HA集群搭建

摘要：前言完全分布式就是把Hadoop核心组件分开部署到不同的服务器节点上运行。通常，建议HDFS和YARN以单独的用户身份运行。在大多数安装中，HDFS进程以“hdfs”执行。YARN通常使用“yarn”帐户。 hadoopHA集群的工作机制如下图： Hadoop HA集群总体上可以分为三部分：Na 阅读全文

posted @ 2022-02-23 18:09 linhaifeng 阅读(681) 评论(0) 推荐(1) 编辑

hadoop原理分析

摘要： hadoop原理分析：强烈推荐阅读：https://www.saoniuhuo.com/article/detail-1124.html hadoop集群如上图所示，HDFS也是按照Master和Slave的结构。分NameNode、SecondaryNameNode、DataNode这几个角色。阅读全文

posted @ 2022-02-23 17:55 linhaifeng 阅读(252) 评论(0) 推荐(0) 编辑

2022年2月22日

hadoop集群+spark集群部署

摘要：一、准备 1.1 软件版本 Ubuntu 16.04.6 (ubuntu-16.04.6-server-amd64.iso) JDK 1.8 (jdk-8u201-linux-x64.tar.gz) Hadoop 2.7.7 (hadoop-2.7.7.tar.gz) Spark 2.1.0 (sp 阅读全文

posted @ 2022-02-22 16:41 linhaifeng 阅读(516) 评论(2) 推荐(0) 编辑

2022年2月21日

Spark运行架构

摘要：一 Spark与hadoop Hadoop有两个核心模块，分布式存储模块HDFS和分布式计算模块Mapreduce Spark 支持多种编程语言，包括 Java、Python、R 和 Scala，同时 Spark 也支持 Hadoop 的底层存储系统 HDFS，但 Spark 不依赖 Hadoop。阅读全文

posted @ 2022-02-21 15:38 linhaifeng 阅读(1241) 评论(0) 推荐(0) 编辑

Hadoop、Hive、Spark 之间是什么关系？

摘要：一前言大数据本身是个很宽泛的概念，Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆，各有各的用处，互相之间又有重合。你可以用汤锅直接当碗吃饭喝汤，你可以用小刀或者刨子去皮。但是每个工具有自己的特性，虽然奇怪的组阅读全文

posted @ 2022-02-21 15:32 linhaifeng 阅读(408) 评论(0) 推荐(0) 编辑

2022年2月17日

Hadoop和Spark联系与区别

摘要：谈到大数据，相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是提留在字面上，并没有对它们进行深入的思考，下面不妨跟我一块看下它们究竟有什么异同。解决问题的层面不一样首先，Hadoop和Apache Spark两者都是大数据框架，但是各自存在的目的不尽相阅读全文

posted @ 2022-02-17 18:19 linhaifeng 阅读(657) 评论(0) 推荐(0) 编辑

Egon林海峰老师

python开发新书推荐：https://egonlin.com/book.html

公告