分布式搭建(一种搭建介绍2)

一:管理节点
安装xCAT:

xCAT (Extreme Cloud Administration Toolkit) 是一个开源的可扩展的高级集群管理和配置工具,允许使用者通过一个单点控制和管理一个集群系统

配置 xCAT节点信息

添加hosts解析

              hosts解析 是域名与ip解析的一个文件

配置DHCP及DNS服务

DHCP 给内部网络或网络服务供应商自动分配IP地址,给用户或者内部网络管理员作为对所有计算机作中央管理的手段

DNS 域名解析服务
安装Slurm

  SLURM (Simple Linux Utility for Resource Management)是一种可用于大型计算节点集群的高度可伸缩和容错的集群管理器和作业调度系统,被世界范围内的超级计算机和计算集群广泛采用。SLURM 维护着一个待处理工作的队列并管理此工作的整体资源利用。它以一种共享或非共享的方式管理可用的计算节点(取决于资源的需求),以供用户执行工作。SLURM 会为任务队列合理地分配资源,并监视作业至其完成。如今,SLURM 已经成为了很多最强大的超级计算机上使用的领先资源管理器,如天河二号上便使用了 SLURM 资源管理系统

配置NFS

  NFS(Network File System)即网络文件系统,是FreeBSD支持的文件系统中的一种,它允许网络中的计算机之间通过TCP/IP网络共享资源。在NFS的应用中,本地NFS的客户端应用可以透明地读写位于远端NFS服务器上的文件,就像访问本地文件一样

配置NTP

  NTP 是一个时间同步服务器

安装CUDA

  CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题

安装Ganglia

  Ganglia是UC Berkeley发起的一个开源集群监视项目,设计用于测量数以千计的节点。Ganglia的核心包含gmond、gmetad以及一个Web前端。主要是用来监控系统性能,如:cpu 、mem、硬盘利用率, I/O负载、网络流量情况等,通过曲线很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用

安装MPI

  MPI是一个跨语言的通讯协议,用于编写并行计算机。支持点对点和广播。MPI是一个信息传递应用程序接口,包括协议和和语义说明,他们指明其如何在各种实现中发挥其特性。MPI的目标是高性能,大规模性,和可移植性。MPI在今天仍为高性能计算的主要模型。

安装Singularity

  HPC是高性能计算(High Performance Computing)机群的简称。指能够执行一般个人电脑无法处理的大资料量与高速运算的电脑,其基本组成组件与个人电脑的概念无太大差异,但规格与性能则强大许多。现有的超级计算机运算速度大都可以达到每秒一兆(万亿,非百万)次以上。“超级计算”(supercomputing)这名词第一次出现,是在1929年《纽约世界报》关于IBM为哥伦比亚大学建造大型报表机(tabulator)的报道

安装的LiCO(联想超计算平台)依赖的列表

       安装RabbitMQ, RabbitMQ作为消息中间件

  安装PostgreSQLLiCO 使用PostgreSQL作为存储业务数据的关系型数据库

  安装InfluxDB  LiCO使用InfluxDB作为存储监控等数据的时序型数据库,

  安装openldap-server

  OpenLDAP是轻型目录访问协议的一个开源实现,LiCO推荐使用OpenLDAP来管理用户,但也支持其他兼容Linux-PAM的认证服务

安装libuser

  libuser模块是一个有用的OpenLDAP工具包。此模块的安装是可选的,但对于本文档,某些命令(如'luseradd')由libuser实现

安装nss-pam-ldapd

  nss-pam-ldapd是一个名字服务交换模块和插入式验证模块。LiCO使用nss-pam-ldapd进行用户认证

安装Gmond GPU插件

posted @ 2018-08-03 08:56  十七楼的羊  阅读(205)  评论(0编辑  收藏  举报