2020系统综合实践第4次实践作业

一、使用Docker-compose实现Tomcat+Nginx负载均衡

nginx正向代理原理
正向代理，"它代理的是客户端"，是一个位于客户端和原始服务器(origin server)之间的服务器，为了从原始服务器取得内容，客户端向代理发送一个请求并指定目标(原始服务器)，然后代理向原始服务器转交请求并将获得的内容返回给客户端。客户端必须要进行一些特别的设置才能使用正向代理。
nginx反向代理原理
反向代理（Reverse Proxy）方式是指以代理服务器来接受internet上的连接请求，然后将请求转发给内部网络上的服务器，并将从服务器上得到的结果返回给internet上请求连接的客户端，此时代理服务器对外就表现为一个服务器（原始服务器对于客户端是透明的）。而正向代理（Forward Proxy），客户端请求时要指定原始服务器，代理再向原始服务器转交请求并将获得的内容返回给客户端。
参考资料：
Nginx 配置详解
 Nginx服务器之负载均衡策略
ngix代理tomcat集群，代理两个以上tomcat

1、创建如下结构

2、编辑各类文件

docker-compose.yml

version: "3.8"
services:
    nginx:
        image: nginx
        container_name: tn_nginx
        ports:
            - 8080:80
        volumes:
            - ./nginx/default.conf:/etc/nginx/conf.d/default.conf # 挂载配置文件
        depends_on:
            - tomcat01
            - tomcat02
            - tomcat03

    tomcat01:
        hostname: tomcat01
        image: tomcat
        container_name: tomcat1
        volumes:
            - ./webapps:/usr/local/tomcat/webapps/ROOT # 挂载web目录


    tomcat02:
        hostname: tomcat02
        image: tomcat
        container_name: tomcat2
        volumes:
            - ./webapps:/usr/local/tomcat/webapps/ROOT # 挂载web目录


    tomcat03:
        hostname: tomcat03
        image: tomcat
        container_name: tomcat3
        volumes:
            - ./webapps:/usr/local/tomcat/webapps/ROOT # 挂载web目录

default.conf

upstream tomcats {
        server tomcat1:8080 max_fails=3 fail_timeout=30s;
        server tomcat2:8080 max_fails=3 fail_timeout=30s;
        server tomcat3:8080 max_fails=3 fail_timeout=30s;
}

server {
        listen 80;
        server_name localhost server;

        location / {
                proxy_set_header  X-Real-IP $remote_addr;
                proxy_set_header  X-Forwarded-For $proxy_add_x_forwarded_for;
                proxy_set_header  Host $http_host;
                proxy_pass http://tomcats;
                proxy_redirect off;
        }
}

index.jsp

<%@ page language="java" contentType="text/html; charset=utf-8"  import="java.net.InetAddress"
    pageEncoding="utf-8"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>Nginx+Tomcat负载均衡</title>
</head>
<body>
     <%
         InetAddress addr = InetAddress.getLocalHost();
         out.println("主机名："+addr.getHostName());
      %>
</body>
</html>

browse.sh

for((i=1;i<=15;i++));
do
content=$(curl -s localhost:8080);
echo ${content#*<body>};
done

3、运行docker-compose构建容器

4、负载均衡配置

在不修改配置文件的情况下，默认为轮询访问，即三个tomcat轮流访问

修改default.conf中的upstream为如下

  ```nginx
  upstream tomcats { 
          server tomcat1:8080 weight=1 max_fails=3 fail_timeout=30s;
          server tomcat2:8080 weight=2 max_fails=3 fail_timeout=30s;
          server tomcat3:8080 weight=3 max_fails=3 fail_timeout=30s;
  }
  ```

再执行browse.sh

这时应权重改变，访问概率变为tomcat3 > tomcat2 > tomcat1

二、使用Docker-compose部署javaweb运行环境

参考链接：老师推荐
项目结构如下：

新增文件default.conf

default.conf

upstream tomcat123 {
    server tomcat00:8080;
}

server {
    listen 8080;
    server_name localhost;

    location / {
        proxy_pass http://tomcat123;
    }
}

修改文件docker-compose.yml

docker-compose.yml

version: "3"   #版本
services:     #服务节点
  tomcat:     #tomcat 服务
    image: tomcat    #镜像
    hostname: hostname       #容器的主机名
    container_name: tomcat00   #容器名
    ports:      #端口
     - "5050:8080"
    volumes:  #数据卷
     - "./webapps:/usr/local/tomcat/webapps"
     - ./wait-for-it.sh:/wait-for-it.sh
    networks:   #网络设置静态IP
      webnet:
        ipv4_address: 15.22.0.15
  mymysql:  #mymysql服务
    build: .   #通过MySQL的Dockerfile文件构建MySQL
    image: mymysql:test
    container_name: mymysql
    ports:
      - "3309:3306" 
#红色的外部访问端口不修改的情况下，要把Linux的MySQL服务停掉
#service mysql stop
#反之，将3306换成其它的
    command: [
            '--character-set-server=utf8mb4',
            '--collation-server=utf8mb4_unicode_ci'
    ]
    environment:
      MYSQL_ROOT_PASSWORD: "123456"
    networks:
      webnet:
        ipv4_address: 15.22.0.6
  nginx:
      image: nginx
      container_name: "nginx-tomcat"
      ports:
          - 8080:8080
      volumes:
          - ./default.conf:/etc/nginx/conf.d/default.conf # 挂载配置文件
      tty: true
      stdin_open: true
      networks:
       webnet:
        ipv4_address: 15.22.0.7
networks:   #网络设置
 webnet:
   driver: bridge  #网桥模式
   ipam:
     config:
      - 
       subnet: 15.22.0.0/24   #子网

其余文件无需修改

修改连接的ip和端口

ifconfig -a命令查看ip地址

在 /webapps/ssmgrogshop_war/WEB-INF/classes/jdbc.properties 修改ip和端口

启动容器

docker-compose up -d

二选一打开网址

http://127.0.0.1:8080/ssmgrogshop_war
http://主机ip地址:8080/ssmgrogshop_war

浏览结果

进入可以进行数据库操作
修改nginx配置文件，反向代理tomcat

upstream tomcats {
    server tomcat00:5050; 
    server tomcat00:5051; 
    server tomcat00:5052; 
     
}

修改yml文件

tomcat01:     
    image: tomcat    
    hostname: hostname       
    container_name: tomcat01   
    ports:      
     - "5051:8080"          #后面访问网页的时候要选择对应的端口号5050
    volumes:  #数据卷
     - "./webapps:/usr/local/tomcat/webapps"
     - ./wait-for-it.sh:/wait-for-it.sh
    networks:   #网络设置静态IP
      webnet:
        ipv4_address: 15.22.0.16
  tomcat02:     
    image: tomcat    
    hostname: hostname       
    container_name: tomcat02   
    ports:      
     - "5052:8080"          #后面访问网页的时候要选择对应的端口号5050
    volumes:  #数据卷
     - "./webapps:/usr/local/tomcat/webapps"
     - ./wait-for-it.sh:/wait-for-it.sh
    networks:   #网络设置静态IP
      webnet:
        ipv4_address: 15.22.0.17
  nginx:
    depends_on:
     - tomcat00
     - tomcat01
     - tomcat02

重新运行容器，可以发现在三个端口下都可以进行访问

三、使用Docker搭建大数据集群环境

1.拉取ubuntu镜像

创建目录，用于向Docker内部的Ubuntu系统传输文件

docker pull ubuntu
cd ~
mkdir build
sudo docker run -it -v /home/ubuntu/build:/root/build --name ubuntu ubuntu

创建并运行容器

2.初始化Ubuntu容器

进入容器中换源

cat<<EOF>/etc/apt/sources.list      
deb http://mirrors.aliyun.com/ubuntu/ bionic main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ bionic main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ bionic-security main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ bionic-security main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ bionic-updates main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ bionic-updates main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ bionic-backports main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ bionic-backports main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ bionic-proposed main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ bionic-proposed main restricted universe multiverse
EOF

apt-get update && apt-get install vim && apt-get install ssh    
vim ~/.bashrc             
/etc/init.d/ssh start  #在该文件中最后一行添加如下内容

3.配置sshd

cd ~/.ssh
ssh-keygen -t rsa #一直回车
cat id_rsa.pub >> authorized_keys 
ssh localhost #测试免密登录

4.安装JDK

apt-get install openjdk-8-jdk
vim ~/.bashrc       # 在文件末尾添加以下两行，配置Java环境变量：
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64/
export PATH=$PATH:$JAVA_HOME/bin
source ~/.bashrc #使.bashrc生效
java -version #验证java

5.保存镜像文件

#另开一个终端
sudo docker commit c52 ubuntu:jdk8   
sudo docker run -it -v /home/ubuntu/build:/root/build --name ubuntu-jdk8 ubuntu:jdk8
#保存镜像ubuntu:jdk8

6.安装Hadoop

cd /root/build
tar -zxvf hadoop-3.1.3.tar.gz -C /usr/local #将hadoop压缩包放入本地build文件夹中
cd /usr/local/hadoop-3.1.3
./bin/hadoop version # 验证安装

7.配置Hadoop集群

hadoop-env.sh

cd /usr/local/hadoop-3.1.3/etc/hadoop
vim hadoop-env.sh
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64/ #末尾加入

修改/usr/local/hadoop/etc/hadoop下的文件

core-site.xml

<?xml version="1.0" encoding="UTF-8" ?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl" ?>
<configuration>
          <property> 
                  <name>hadoop.tmp.dir</name>
                  <value>file:/usr/local/hadoop-3.1.3/tmp</value>
                  <description>Abase for other temporary directories.</description>
          </property>
          <property>
                  <name>fs.defaultFS</name>
                  <value>hdfs://master:9000</value>
          </property>
</configuration>

hdfs-site.xml

<?xml version="1.0" encoding="UTF-8" ?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl" ?>
<configuration>
        <property>
                <name>dfs.replication</name>
                <value>1</value>
        </property>
        <property>
                <name>dfs.namenode.name.dir</name>
		        <value>file:/usr/local/hadoop-3.1.3/tmp/dfs/name</value>
	</property>
	<property>
                <name>dfs.datanode.data.dir</name>
                <value>file:/usr/local/hadoop-3.1.3/tmp/dfs/data</value>
	</property>
	<property>
                <name>dfs.permissions.enabled</name>
                <value>false</value>
        </property>
</configuration>

mapred-site.xml

<?xml version="1.0" ?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl" ?>
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>yarn.app.mapreduce.am.env</name>
        <value>HADOOP_MAPRED_HOME=/usr/local/hadoop-3.1.3</value>
    </property>
    <property>
        <name>mapreduce.map.env</name>
        <value>HADOOP_MAPRED_HOME=/usr/local/hadoop-3.1.3</value>
    </property>
    <property>
        <name>mapreduce.reduce.env</name>
        <value>HADOOP_MAPRED_HOME=/usr/local/hadoop-3.1.3</value>
    </property>
</configuration>

yarn-site.xml

<?xml version="1.0" ?>
<configuration>
<!-- Site specific YARN configuration properties -->
        <property>
               <name>yarn.nodemanager.aux-services</name>
               <value>mapreduce_shuffle</value>
        </property>
        <property>
               <name>yarn.resourcemanager.hostname</name>
               <value>Master</value>
        </property>
        <!--虚拟内存和物理内存比，不加这个模块程序可能跑不起来-->
        <property>
               <name>yarn.nodemanager.vmem-pmem-ratio</name>
               <value>2.5</value>
        </property>
</configuration>

cd /usr/local/hadoop-3.1.3/sbin

对于start-dfs.sh和stop-dfs.sh文件，添加下列参数

HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

对于start-yarn.sh和stop-yarn.sh，添加下列参数

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

8.运行Hadoop集群

保存镜像

sudo docker commit c53 ubuntu/hadoopinstalled

从三个终端分别开启三个容器运行ubuntu/hadoop镜像

# 第一个终端
sudo docker run -it -h master --name master ubuntu/hadoop
# 第二个终端
sudo docker run -it -h slave01 --name slave01 ubuntu/hadoop
# 第三个终端
sudo docker run -it -h slave02 --name slave02 ubuntu/hadoop

三个终端分别打开/etc/hosts,根据各自ip修改为如下形式

cat /etc/hosts
172.17.0.5	    master
172.17.0.6      slave01
172.17.0.7      slave02

在master结点测试ssh；连接到slave结点

ssh slave01
ssh slave02
exit 退出

修改master上workers文件；将localhost修改为如下所示

vim /usr/local/hadoop-3.1.3/etc/hadoop/workers
slave01
slave02

9.测试Hadoop集群

cd /usr/local/hadoop-3.1.3
bin/hdfs namenode -format      #首次启动Hadoop需要格式化
sbin/start-all.sh              #启动所有服务

使用jps查看三个终端，如图所示

建立HDFS文件夹

./bin/hdfs dfs -mkdir -p /user/root/input 
./bin/hdfs dfs -put ./etc/hadoop/*.xml input 
./bin/hdfs dfs -ls /user/root/input

执行实例程序

./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar grep input output 'dfs[a-z.]+'

获取输出内容
```
hdfs dfs -cat output/*
```

停止所有服务

sbin/stop-all.sh

四、小结

1、主要问题和解决方法

问题一：使用browse.sh时出现:Syntax error: Bad for loop variable的错误

解决方法：从 ubuntu 6.10 开始，ubuntu 就将先前默认的bash shell 更换成了dash shell；
其表现为 /bin/sh 链接倒了/bin/dash而不是传统的/bin/bash。
ubuntu edgy是第一个将dash作为默认shell来发行的版本，这似乎是受了debian的影响。
wiki 里面有官方的解释，https://wiki.ubuntu.com/DashAsBinSh，主要原因是dash更小，运行更快，还与POSIX兼容。
但目前存在的问题是，由于shell的更换，致使很多脚本出错，毕竟现在的很多脚本不是100%POSIX兼容。
将默认的shell改回bash的方法为：在终端执行 sudo dpkg-reconfigure dash，然后选择no。

问题二：在执行apt-get install ssh的时候出现问题

解决方法：源的问题，先换源，这里推荐换阿里源，然后再更新就好了。

问题三：hadoop配置文件问题，以及多次初始化导致无节点的问题。

解决方法：百度了方法说是吧data和name里面的文件删掉，或者说使两者的current文件下的id改为一致
，我没试成功，就按照存储好的镜像重做了，感觉重试更快，也就十来分钟。
配置文件的问题就一开始按照网上的配置文件写，发现有一定的错误，问了同学和参考了大数据的配置文件即可。

2、经验和感想+花费时间

实验看似不难，操作起来小错误真的一大堆，有的错误莫名其妙，而且耗费大量时间有时候也无法解决，所以需要很大的耐心。这次实验感觉难度还是有的，主要就是要一步一步慢慢来的同时加以理解，并且理解完后先充分理解后几步的操作和之间的联系，最后先全都理解再开始做，不懂的情况下盲目操作很容易出错。带着细心，耐心和理解去完成实验，才是最有效率的方法。这次实验虽然耗费一定的时间，也让我学到了很多关于部署环境的知识，受益匪浅。

项目	时间（估算）
Tomcat+Nginx负载均衡	3h
部署javaweb运行环境	4h
用Docker搭建大数据集群环境	5h
写博客	2h
总计	14h

posted @ 2020-05-16 14:54 -CTH 阅读(275) 评论(0) 编辑收藏举报

刷新页面返回顶部

-CTH

2020系统综合实践 第4次实践作业