新手入门-虚拟机中docker下安装Spark集群尝试

一、按照网络教程安装VM15

  可参考:https://blog.csdn.net/Fly_1213/article/details/90897738

二、按照网络教程,VM安装 ubuntu-18.04.4 桌面版,桌面版是图形化界面,相对新手来说比较友好

  可参考:https://www.jianshu.com/p/55bb32be385e

  安装完成后,建议安装 VMware Tools

    安装完成并重启,用默认账号进入,并使用终端设置root用户密码,后面的操作都需要用root用户。

  设置root用户密码步骤:

  1、打开终端,输入 sudo passwd root 命令

  2、输入当前用户密码进行验证

  3、输入UNIX密码及确认密码(这个密码就是root用户的密码)

  

 

四、终端登录root用户,并安装 docker

  1、终端登录root用户

    su

    输入密码

    cd (切换路径到root目录)  

  

 

  2、安装docker

  sudo apt-get install -y docker.io  -- 安装docker

  docker --version -- 验证docker版本,确认是否安装成功

  systemctl start docker -- 启动docker

  systemctl enable docker -- 设置开机启动

  

五、docker中安装 ubuntu 镜像

  docker pull daocloud.io/library/ubuntu:latest

 

六、启动一个 ubuntu镜像的容器,并安装 java8、Zookeeper、 Hadoop、Spark、Scala

  因为网上教程都比较早,提供的一些链接无效,或者都是外网,直接wget安装速度较慢,建议使用迅雷下载后,在虚拟机中直接使用。

  这里使用的各种包如下:

  jdk-8u5-linux-x64.tar.gz    链接:https://www.oracle.com/java/technologies/javase/javase8-archive-downloads.html   现在需要登录后才能下载

  zookeeper-3.4.9.tar.gz     链接:http://archive.apache.org/dist/zookeeper/zookeeper-3.4.9/zookeeper-3.4.9.tar.gz

  hadoop-2.7.7.tar.gz          链接:http://mirrors.sonic.net/apache/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gz

  spark-2.2.0-bin-hadoop2.7.tgz     链接:https://d3kbcqa49mib13.cloudfront.net/spark-2.2.0-bin-hadoop2.7.tgz

  scala-2.11.11.tgz              链接:https://downloads.lightbend.com/scala/2.11.11/scala-2.11.11.tgz

  

  下载后,复制到虚拟机的目录中,这里为了方便,直接放到了 root 目录下

 

  1、因ubuntu 的 apt 源为国外地址,下载速度比较慢,这里先修改ubuntu虚拟机的下载源

    a、备份原文件:

      sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak

    b、编辑源列表文件:

      gedit /etc/apt/sources.list

    c、将原来的列表情况,添加以下内容并保存: 

deb http://mirrors.aliyun.com/ubuntu/ bionic main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ bionic-security main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ bionic-updates main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ bionic-proposed main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ bionic-backports main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ bionic main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ bionic-security main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ bionic-updates main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ bionic-proposed main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ bionic-backports main restricted universe multiverse

 

    d、执行 apt update

    e、尝试安装 vim ,如果报错   vim : 依赖: vim-common (= 2:7.4.1689-3ubuntu1.4) 但是 2:8.0.1453-1ubuntu1.1 正要被安装

       参考这里解决:https://www.cnblogs.com/flash-player/p/10274783.html

 

 

  2、启动一个容器,并挂载本地Linux系统的etc/apt文件,将虚拟机中的 源列表文件复制到容器中

  docker run -ti -v /etc/apt/:/home/etc daocloud.io/library/ubuntu:latest

    

  

  删除容器下的sources.lis   rm /etc/apt/sources.list

  将本地sources.list 复制过来 cp /home/etc/sources.list  /etc/apt/

  

  在安装各工具之前,先安装一些工具(容器中)

  apt update  -- 更新

  apt install wget -- 安装 wget,下载工具

  apt install vim -- 安装 vim ,文档编辑工具

  apt install net-tools -- 网络工具,如 ifconfig

  apt install iputils-ping -- ping工具,如 ping 

 

  3、新建目录 /root/soft/ ,用于存放下载的压缩包

  exit 退出容器

  docker cp /root/文件名 容器id:/root/soft/  -- 使用此命令复制文件到容器中,如:

    docker cp /root/jdk-8u5-linux-x64.tar.gz b4edbc5885c5:/root/soft

  复制完成后,进入container

     docker start -i b4edbc5885c5

  查看文件是否已复制

    cd /root/soft

    ls

  

  4、安装 java8

 1 mkdir -p /usr/lib/jvm/oracle_jdk8
 2 cd /root/soft
 3 tar -zxf jdk-8u5-linux-x64.tar.gz -C /usr/lib/jvm/oracle_jdk8
 4 update-alternatives --install /usr/bin/java java /usr/lib/jvm/oracle_jdk8/jdk1.8.0_05/jre/bin/java 2000
 5 update-alternatives --install /usr/bin/javac javac /usr/lib/jvm/oracle_jdk8/jdk1.8.0_05/bin/javac 2000
 6 update-alternatives --config java
 7 update-alternatives --config javac
 8  
 9 export J2SDKDIR=/usr/lib/jvm/oracle_jdk8/jdk1.8.0_05
10 export J2REDIR=/usr/lib/jvm/oracle_jdk8/jdk1.8.0_05/jre
11 export PATH=$PATH:/usr/lib/jvm/oracle_jdk8/jdk1.8.0_05/bin:/usr/lib/jvm/oracle_jdk8/jdk1.8.0_05/db/bin:/usr/lib/jvm/oracle_jdk8/jdk1.8.0_05/jre/bin
12 export JAVA_HOME=/usr/lib/jvm/oracle_jdk8/jdk1.8.0_05
13 export DERBY_HOME=/usr/lib/jvm/oracle_jdk8/jdk1.8.0_05/db
14 
15 java -version

   

  5、安装其他的准备工作

    新建部分目录    

cd soft
mkdir apache
mkdir scala  #这个目录是用来安装 scala 的
cd apache
mkdir zookeeper  # 安装zookeeper
mkdir hadoop  # 安装 hadoop
mkdir spark  # 安装 spark

  zookeeper-3.4.9.tar.gz  文件移动至  /root/soft/apache/zookeeper/

  hadoop-2.7.7.tar.gz      文件移动至  /root/soft/apache/hadoop/

  spark-2.2.0-bin-hadoop2.7.tgz   文件移动至  /root/soft/apache/spark/

  scala-2.11.11.tgz          文件移动至  /root/soft/scala/

 

  6、安装 Zookeeper  

    参考:https://www.jianshu.com/p/ee210190224f     安装 Zookeeper  部分   

 

  7、安装 Hodoop

    参考:https://www.jianshu.com/p/ee210190224f     安装 Hadoop   部分

    注意设置 JAVA_HOME,及 hadoop的文件夹,这里使用的是 hadoop-2.7.7

    多加一步,修改 hdoop-env.sh 中的  JAVA_HOME,为 /usr/lib/jvm/oracle_jdk8/jdk1.8.0_05 ,避免后面启动时异常

    参考:https://blog.csdn.net/dianzishijian/article/details/52094569

  

  8、 安装 Spark

    参考:https://www.jianshu.com/p/ee210190224f   安装 Spark 部分

 

  9、安装 Scala

    参考:https://www.jianshu.com/p/ee210190224f   安装 Scala 部分

 

  10、安装 SSH, 配置无密码访问集群其它机器

    参考:https://www.jianshu.com/p/ee210190224f    安装SSH 部分

    这里需要注意的是,报错的目录,报错的是哪个路径,建哪个路径即可。     

 

  11、集群配置,参考 https://www.jianshu.com/p/ee210190224f    保存镜像副本  部分以后即可。

 

 

  最后。。。。。。还是没有运行起来,直接把VM干死机了。等查到原因再来补充~

 

posted @ 2020-05-27 16:35  我知道你的存在  阅读(1014)  评论(0编辑  收藏  举报