2020系统综合实践 第4次实践作业

使用Docker-compose实现Tomcat+Nginx负载均衡

(1)理解反向代理原理

参考资料


总结起来就是一句话:正向代理代理客户端,反向代理代理服务器

(2)nginx代理tomcat集群,代理2个以上tomcat;

参考资料
文件结构

编写default.conf

user  nginx;
worker_processes  1;
 
error_log  /var/log/nginx/error.log warn;
pid        /var/run/nginx.pid;
 
 
events {
    worker_connections  1024;
}
 
 
http {
    include       /etc/nginx/mime.types;
    default_type  application/octet-stream;
 
    log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';
 
    access_log  /var/log/nginx/access.log  main;
 
    sendfile        on;
    #tcp_nopush     on;
 
    keepalive_timeout  65;
 
    #gzip  on;
 
    #include /etc/nginx/conf.d/*.conf;
 
    upstream tomcat_client {
         server t01:8080 ;
         server t02:8080 ;
    } 
 
    server {
        server_name "";
        listen 80 default_server;
        listen [::]:80 default_server ipv6only=on;
 
        location / {
            proxy_pass http://tomcat_client;
            proxy_redirect default;
            proxy_set_header Host $host;
            proxy_set_header X-Real-IP $remote_addr;
        }
    }
}

编写docker-compose.yml

version: "3"
services:
  tomcat001:
    image: tomcat:8.5.0
    ports:
      - "8083:8080"
    restart: "always"
    container_name: tomcat001
    volumes:
            - ./tomcat1:/usr/local/tomcat/webapps/ROOT 
  tomcat002:
    image: tomcat:8.5.0
    ports:
      - "8082:8080"
    container_name: tomcat002
    restart: "always"
    volumes:
            - ./tomcat2:/usr/local/tomcat/webapps/ROOT
  nginx:
    image: nginx
    volumes:
      - ./nginx/default.conf:/etc/nginx/nginx.conf
    ports:
      - "81:80"
    links:
      - tomcat001:t01
      - tomcat002:t02

两个tomcat的html文件
tomcat1

<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<title>tomcat</title>
</head>
<body>
    <h1>This is tomcat NO.1</h1>
</body>
</html>

tomcat2

<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<title>tomcat</title>
</head>
<body>
    <h1>This is tomcat NO.2</h1>
</body>
</html>

构建

sudo docker-compose up -d --build

测试(默认负载均衡是轮询,两个不同页面会轮流出现)


(3)了解nginx的负载均衡策略,并至少实现nginx的2种负载均衡策略;

轮询策略:每个服务器轮流提供服务
这是默认策略,直接测试就好了
访问100次,观察两种页面出现的顺序关系和次数统计
由于抓取的是网页的源代码,如果直接输出源代码不利于观察,所以算法的思路就是识别和统计这两种不同的源代码,并将一个网页标记为page1,另一个标记为page2


权重策略:每个服务器以正比于其权重的概率被访问
修改default.conf

upstream tomcat_client {
         server t01:8080 weight=3;
         server t02:8080 weight=1;
    } 

访问10000次,统计两种不同页面出现的次数(我本来以为结果会是接近3:1,没想到会是刚刚好的3:1,试了几次都是这样)

使用Docker-compose部署javaweb运行环境

(1)分别构建tomcat、数据库等镜像服务;
(2)成功部署Javaweb程序,包含简单的数据库操作;
(3)为上述环境添加nginx反向代理服务,实现负载均衡。
鉴于javaweb学习成本太高和一周4个实验课的压力,最终选择使用参考链接中的项目。
文件结构

其中wait-for-it.sh参考这里
配置文件
docker-compose.yml

version: "3"   
services:    
  tomcat00:     
    image: tomcat    
    hostname: hostname       
    container_name: tomcat00   
    ports:      
     - "5050:8080"          #后面访问网页的时候要选择对应的端口号5050
    volumes:  #数据卷
     - "./webapps:/usr/local/tomcat/webapps"
     - ./wait-for-it.sh:/wait-for-it.sh
    networks:   #网络设置静态IP
      webnet:
        ipv4_address: 15.22.0.15
  mymysql:  #mymysql服务
    build: .   #通过MySQL的Dockerfile文件构建MySQL
    image: mymysql:test
    container_name: mymysql
    ports:
      - "3309:3306" 

    command: [
            '--character-set-server=utf8mb4',
            '--collation-server=utf8mb4_unicode_ci'
    ]
    environment:
      MYSQL_ROOT_PASSWORD: "123456"
    networks:
      webnet:
        ipv4_address: 15.22.0.6
  nginx:
      image: nginx
      container_name: "nginx-tomcat"
      ports:
          - 8080:8080
      volumes:
          - ./default.conf:/etc/nginx/conf.d/default.conf # 挂载配置文件
      tty: true
      stdin_open: true
      networks:
       webnet:
        ipv4_address: 15.22.0.7
networks:   #网络设置
 webnet:
   driver: bridge  #网桥模式
   ipam:
     config:
      - 
       subnet: 15.22.0.0/24   #子网

default.conf

upstream tomcats {
    server tomcat00:5050; 

}

server {
    listen 8080
    server_name localhost;

    location / {
        proxy_pass http://tomcat123;
        proxy_set_header   Host    $host; 
        proxy_set_header   X-Real-IP   $remote_addr; 
        proxy_set_header   X-Forwarded-For $proxy_add_x_forwarded_for;

    }
}

docker-entrypoint.sh

#!/bin/bash
mysql -uroot -p123456 << EOF
source /usr/local/grogshop.sql;

Dockerfile

#  这个是构建MySQL的dockerfile
 
FROM registry.saas.hand-china.com/tools/mysql:5.7.17
 
# mysql的工作位置
ENV WORK_PATH /usr/local/

# 定义会被容器自动执行的目录
ENV AUTO_RUN_DIR /docker-entrypoint-initdb.d
 
#复制gropshop.sql到/usr/local 
COPY grogshop.sql  /usr/local/
#把要执行的shell文件放到/docker-entrypoint-initdb.d/目录下,容器会自动执行这个shell
COPY docker-entrypoint.sh  $AUTO_RUN_DIR/
 
#给执行文件增加可执行权限
RUN chmod a+x $AUTO_RUN_DIR/docker-entrypoint.sh
 
# 设置容器启动时执行的命令
#CMD ["sh", "/docker-entrypoint-initdb.d/import.sh"]

修改连接数据库的ip为本机ip

cd /home/tinor/lzz/webapps/ssmgrogshop_war/WEB-INF/classes
vim jdbc.properties

构建并且启动容器

docker-compose up -d --build

访问网页并测试数据库操作

localhost:5050/ssmgrogshop_war

以新增商品为例,新增一个酸奶,对于数据库的增加操作


删除娃哈哈和雪碧


修改可乐价格


修改以下文件,实现反向代理
default.conf

upstream tomcat123 {
    server tomcat00:8080;
}

server {
    listen 8080;
    server_name localhost;

    location / {
        proxy_pass http://tomcat123;
    }
}

yml文件

version: "3"   #版本
services:     #服务节点
  tomcat:     #tomcat 服务
    image: tomcat    #镜像
    hostname: hostname       #容器的主机名
    container_name: tomcat00   #容器名
    ports:      #端口
     - "5050:8080"
    volumes:  #数据卷
     - "./webapps:/usr/local/tomcat/webapps"
     - ./wait-for-it.sh:/wait-for-it.sh
    networks:   #网络设置静态IP
      webnet:
        ipv4_address: 15.22.0.15
  mymysql:  #mymysql服务
    build: .   #通过MySQL的Dockerfile文件构建MySQL
    image: mymysql:test
    container_name: mymysql
    ports:
      - "3309:3306" 
#红色的外部访问端口不修改的情况下,要把Linux的MySQL服务停掉
#service mysql stop
#反之,将3306换成其它的
    command: [
            '--character-set-server=utf8mb4',
            '--collation-server=utf8mb4_unicode_ci'
    ]
    environment:
      MYSQL_ROOT_PASSWORD: "123456"
    networks:
      webnet:
        ipv4_address: 15.22.0.6
  nginx:
      image: nginx
      container_name: "nginx-tomcat"
      ports:
          - 8080:8080
      volumes:
          - ./default.conf:/etc/nginx/conf.d/default.conf # 挂载配置文件
      tty: true
      stdin_open: true
      networks:
       webnet:
        ipv4_address: 15.22.0.7
networks:   #网络设置
 webnet:
   driver: bridge  #网桥模式
   ipam:
     config:
      - 
       subnet: 15.22.0.0/24   #子网

Dockerfile不用修改
重新构建和启动容器即可。

通过8080端口访问nginx服务器
可以看到实际访问到的网页是tomcat服务器中的项目,说明反向代理成功了

使用Docker搭建大数据集群环境

(1)hadoop分布式集群环境配置,至少包含三个节点(一个master,两个slave);

在docker安装ubuntu系统

docker pull ubuntu

安装完成后,在启动Ubuntu镜像时,需要先在个人文件下创建一个目录,用于向Docker内部的Ubuntu系统传输文件;然后再在Docker上运行Ubuntu系统;
-v 表示docker内部的ubuntu系统/root/build目录与本地/home/tinor/build共享;这可以很方便将本地文件上传到Docker内部的Ubuntu系统;

mkdir build
docker run -it -v /home/tinor/build:/root/build --name ubuntu ubuntu

Ubuntu系统初始化
刚安装好的Ubuntu系统,是一个很纯净的系统,很多软件是没有安装的,所以我们需要先更新下Ubuntu系统的源以及安装一些必备的软件;
以下操作在ubuntu容器内进行
更新系统软件源

apt-get update

安装vim和sshd

apt-get install vim
apt-get install ssh  #在开启分布式Hadoop时,需要用到ssh连接slave

开启sshd服务器

/etc/init.d/ssh start

把这启动命令写进~/.bashrc文件,这样我们每次登录Ubuntu系统时,都能自动启动sshd服务

vim ~/.bashrc

在该文件中最后一行添加如下内容:

/etc/init.d/ssh start

配置sshd
安装好sshd之后,我们需要配置ssh无密码连接本地sshd服务,如下命令:

cd ~/.ssh
ssh-keygen -t rsa #一直按回车键即可
cat id_rsa.pub >> authorized_keys  

接下来使用的安装方法是大数据实验课程的方法
先准备好jdk和hadoop的安装包(安装包是大数据的老师提供的,直接粘贴到虚拟机里就行了)

安装JDK
在/usr/lib 目录下新建文件夹jvm,将JDK安装包解压到该文件夹下。

tar -zxvf /root/build/jdk-8u162-linux-x64.tar.gz -C /usr/lib/jvm

jdk环境变量配置
vim打开用户环境变量配置文件即用户主目录下的.bashrc文件,添加如下环境变量;

vim ~/.bashrc
export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_162
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib
export PATH=$PATH:$JAVA_HOME/bin

用 source ~/.bashrc命令使之生效。在任意目录下查看 Java 版本号 或执行java 命令出现如下提示则表示 JDK 环境配置成功。

安装Hadoop
把下载下来的Hadoop安装文件放到共享目录/home/tinor/build下面,然后在Docker内部Ubuntu系统的/root/build目录即可获取到Hadoop安装文件;

cd /root/build
tar -zxvf hadoop-3.1.3.tar.gz -C /usr/local   #大数据实验课用的是3.1.3版本,刚好拿过来用

Hadoop环境变量配置(将上面的环境变量修改为如下,是修改不是追加)

vim ~/.bashrc
export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_162
export JRE_HOME=$JAVA_HOME/jre
export HADOOP_HOME=/usr/local/hadoop-3.1.3
export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$JAVA_HOME/bin

执行hadoop version 命令测试环境变量是否配置成功,配置成功则显示如下版本信息。

配置Hadoop集群
进入配置文件存放目录

cd /usr/local/hadoop-3.1.3/etc/hadoop

配置hadoop-env.sh

export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_162

配置workers

slave01
slave02

配置core-site.xml

<configuration>
	<property>
		<name>hadoop.tmp.dir</name>
		<value>file:/usr/local/hadoop-3.1.3/tmp</value>
		<description>A base for other temporary directories.</description>
	</property>
	<property>
		<!--hdfs://host:port-->
		<name>fs.defaultFS</name>
		<value>hdfs://Master:9000</value>
	</property>
</configuration>

配置hdfs-site.xml

<configuration>
	<property>
		<name>dfs.replication</name>
		<value>1</value>
	</property>
	<property>
		<name>dfs.namenode.name.dir</name>
		<value>file:/usr/local/hadoop-3.1.3/tmp/dfs/name</value>
	</property>
	<property>
		<name>dfs.datanode.data.dir</name>
		<value>file:/usr/local/hadoop-3.1.3/tmp/dfs/data</value>
	</property>
</configuration>

配置mapred-site.xml

<configuration>
	<property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
	</property>
	<property>
		<name>mapreduce.jobhistory.address</name>
		<value>Master:10020</value>
	</property>
	<property>
		<name>mapreduce.jobhistory.webapp.address</name>
		<value>Master:19888</value>
	</property>
	<property>
		<name>mapreduce.application.classpath</name>
		<value>/usr/local/hadoop-3.1.3/share/hadoop/mapreduce/lib/*,/usr/local/hadoop-3.1.3/share/hadoop/mapreduce/*</value>
	</property>
</configuration>

配置yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->
	<property>
		<name>yarn.resourcemanager.hostname</name>
		<value>Master</value>
	</property>
	<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
	</property>
	<property>
		<name>yarn.nodemanager.vmem-pmem-ratio</name>
		<value>2.5</value>	
	</property>
</configuration>

emmm 在这个位置其实应该还有一步修改脚本的操作,第一次做到这里的时候没有修改脚本,导致出现错误,所以修改脚本的操作就放在问题4了。

保存这个镜像,在其他终端输入如下命令:

docker commit [容器id] ubuntu/hadoopinstalled

在三个终端上开启三个容器运行ubuntu/hadoopinstalled镜像,分别表示Hadoop集群中的master,slave01和slave02;

# 第一个终端
docker run -it -h master --name master ubuntu/hadoopinstalled
# 第二个终端
docker run -it -h slave01 --name slave01 ubuntu/hadoopinstalled
# 第三个终端
docker run -it -h slave02 --name slave02 ubuntu/hadoopinstalled

接着配置master,slave01和slave02的地址信息,这样他们才能找到彼此,分别打开/etc/hosts可以查看本机的ip和主机名信息,最后得到三个ip和主机地址信息如下:

172.17.0.2      master
172.17.0.3      slave01
172.17.0.4      slave02

最后把上述三个地址信息分别复制到master,slave01和slave02的/etc/hosts即可

我们可以用如下命令来检测下是否master是否可以连上slave01和slave02

ssh slave01
ssh slave02

在master终端上,运行如下命令开启hadoop集群:

cd /usr/local/hadoop-3.1.3
hdfs namenode -format   #格式化
start-dfs.sh   #启动 HDFS
start-yarn.sh  #启动 YARN
mapred --daemon start historyserver   #启动 Job History Server

第二条命令执行后要在输出中找到这样的提示才算成功

这时Hadoop集群就已经开启,我们可以在master,slave01和slave02上分别运行命令jps查看运行结果;

用hdfs dfsadmin –report 查看信息,Live datanodes 不为 0 表示数据节点正常启动。

(2)运行hadoop自带的测试实例

准备输入文件夹和输入文件

cd /usr/local/hadoop-3.1.3
hdfs dfs -mkdir /user
hdfs dfs -mkdir /user/tinor
hdfs dfs -mkdir /user/tinor/input
hdfs dfs -put etc/hadoop/*.xml /user/tinor/input  #将xml复制到input下,作为输入文件

运行grep实例程序:

hadoop jar /usr/local/hadoop-3.1.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar grep /user/tinor/input /user/tinor/output 'dfs[a-z.]+'

查看输出结果:

hdfs dfs -cat /user/tinor/output/*

(4)实验报告

遇到的问题

问题1:

解决:
要注意自己的文件路径和教程可能不一样

问题2:

解决:回看博客前面的内容,发现自己把公钥放错地方了

问题3:
这是一个很坑爹的问题,当我把hadoop环境安装好之后,也保存了镜像,这时候系统提示存储空间不足了,然后我看到这个镜像2G左右大小,然后想到等一下得要开启3个容器,这个虚拟机只分配了4G内存,估计不够用,于是关机多分配一些内容,然后重新启动的时候就进不去了。
解决:
我想到那个存储空间不足的提示,大概是存储空间被挤爆了然后开机的时候出现问题,于是去找度娘,找到了一个靠谱的博客(忘记记下地址了,现在找不到了),大概意思就是按ctrl+Alt+F2可以进入终端,然后用命令行删掉一些文件,用df-l查看磁盘用量,等删到磁盘空间用量小于100%的时候就可以开机了。
问题4:

解决:查询了百度,找到如下方案
在Hadoop安装目录下找到sbin文件夹
在里面修改四个文件
1、对于start-dfs.sh和stop-dfs.sh文件,添加下列参数:

#!/usr/bin/env bash
HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

2、对于start-yarn.sh和stop-yarn.sh文件,添加下列参数:

#!/usr/bin/env bash
YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

问题5:两个slave节点都没有datanode

解决:
这个问题做大数据实验的时候就遇到了,没想到这次又遇到了,跟当时一样,用百度的方法解决没有用,最后还是返工重新配置一遍结果就好了,历史总是惊人的相似...
PS:返工是从开启三个容器那一步开始的。

后来看到群里在讨论这个问题,所以就把老师和同学的回答码在这里
多次格式化导致ClusterID不一致等问题?
第一种解决方法是删除安装目录下的tmp文件夹后重新格式化;
第二种解决方法是打开${HADOOP_HOME}/tmp/dfs/name/current/VERSION和${HADOOP_HOME}/tmp/dfs/data/current/VERSION将两个文件里的clusterID设置为一致。


问题6:不会javaweb开发
解决:尝试学习javaweb,但是学习成本太高,又加上每周要做4个实验,最后还是选择向参考项目屈服。

经验和感想

这次的实验量明显比之前的大,难度也更高。之前的几次实验都是一直参考其他同学的做法,做得都比较顺利,但是做完会有一种很空虚的感觉,于是这次我一开始就不打算去借鉴其他同学的博客,很早就开始自己动手做,这才发现自己动手做是真的不容易,跌跌撞撞会遇到好多问题,而且每次解决都要花好多时间,最终实验一和实验三是自己独立做完的,实验二由于实在没时间学javaweb就用了参考项目,也参考了其他同学的做法。最后的感想就是自己独立完成的话真的很痛苦,但是也能明显感觉到自己对问题的理解更加透彻,对知识和技能掌握得会更好一些。

耗时

第一个实验 2h
第二个实验 先是折腾了3h无果,去做第三个实验,后来又折腾了6h才做完
第三个实验 不断返工,中间还遇到了虚拟机因为存储满无法启动的问题,来来回回花了12h左右
总计23h(包括写博客时间)

posted @ 2020-05-17 15:47  Tinor_yu  阅读(352)  评论(0编辑  收藏  举报