须在十四台机器上面安装系统并配置。谨慎操作,不能删除原有系统,只能利用空闲空间加装系统。

  选择debian 8.2系统,首先因为CentOS在机器上面安装失败,可能跟lvm有关,其次因为ubuntu内核版本太新,所以选择这个。

  楼下机房只能通清华源,所以要用mirrors.tuna.tsinghua.edu.cn,ip是59.66.131.249。

  一、安装完成以后不能联网,要如下配置:

    1、在/etc/resolv.conf中添加:

      nameserver 59.66.131.249

      新:此ip经常改,还是要换成网管那边的dns域名才行

    2、在/etc/hosts中添加:

      59.66.131.249 mirrors.tuna.tsinghua.edu.cn

      此步骤必不可少,否则不通

      新:此ip经常改,要从hosts里面删除此行

    3、在/etc/network/interfaces中写入:

      auto eth0

      iface eth0 inet static

      address 11.11.0.xxx

      netmask 255.255.0.0

      broadcast 11.11.255.255

      gateway 11.11.2.1 (?也可能是11.11.0.1,node102怎么配置网关都不通,为什么)

    4、编辑/etc/apt/sourcelist:

      deb http://mirrors.tuna.tsinghua.edu.cn/debian jessie main contrib

      deb-src http://mirrors.tuna.tsinghua.edu.cn/debian jessie main contrib

      deb http://mirrors.tuna.tsinghua.edu.cn/debian jessie-updates main

      deb-src http://mirrors.tuna.tsinghua.edu.cn/debian jessie-updates main

    5、还有可能要执行命令

        ifconfig eth0 11.11.0.xxx/16 up

        route add default gw 11.11.2.1

      才行。之前node102出问题就是没有执行配置ip命令的缘故,这个在route命令之前执行就没问题。

    6、debian ssh连接须安装ssh服务,默认没有安装,命令格式别于其他linux:

        apt-get install openssh-server (直接安装openssh提示没有这个包,我也真是醉了)

      然后就修改/etc/ssh/sshd_config文件,将里面一个准许root登录的选项后面参数改为yes,另一个准许authentication的选项前面的#去掉就可以了。

  二、编配mtcp with dpdk2.1需要做的:

    debian没有默认安装linux内核头文件,须安装:

      apt-get install linux-headers-`uname -r`

    编译仍然报错,居然提示没有sudo~~(debian默认不安装sudo,貌似记忆中不是这样的呀):

      apt-get install sudo

    最后编译mtcp/src仍然出现错误:

      cpu.c:8:18: fatal error: numa.h: No such file or directory

      #include <numa.h>
                ^
      compilation terminated.
      Makefile:76: recipe for target 'cpu.o' failed
      make: *** [cpu.o] Error 1

    那是因为没有安装libnuma开发包,所以:

      apt-get install libnuma-dev

    如此mtcp编译不再报错。

    安装文件列表:

      make gcc libnuma-dev sudo linux-headers-`uname -r` 

 

  不对,仍然存在问题:

  1、运行例子epserver的时候报错:

    Cause: Cannot init mbuf pool

  解决办法:在分配hugepages的时候给分配大一点,搞个2048页就不报错了。不知道为什么。

  后续:Ctrl+Z没有关闭完全,用Ctrl+C关闭就不会在再次执行的时候报错了,但是page还是必须分配大一点,可能2048还不够,要4096才行。

  2、运行epwget报出

    [GetOutputInterface: 28] [WARNING] No route to 11.11.0.101

    [GetOutputInterface: 28] [WARNING] No route to 11.11.0.101

  解决办法:说是

    Try to turn off your network-manager for xge*. The network manager can override the IP configuration set by install.py in PSIO driver

  不知何故,亦不知如何禁止network-manager for xge*,xge是网卡系列驱动。# 最后解决,原因是网没有通,安装ib网进行集群间通讯,使用原来的网卡绑定就可以。安装ib网的时候无视报错,它有提示有个服务须restart,restart就行,然后使用命令

    ifconfig ib0 ipaddr/mask up

  就行了。