随笔分类 -  Linux

上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 22 下一页
摘要:1. heartbeat是一个软件包,实现HA的功能(目前heartbeat只支持双机的HA)。原理很简单,设定一个primary server,设定一个需要HA的resource,然后将其他的机器(称为backup server)和这台server连起来, backup servers不停的接收来自primary server的heartbeat,一旦heartbeat中断,那么,backup server接替工作。 2. 为了放置primary server和backup server中间通讯的failure,一般我们推荐用多个physical connection来连接两台机器。比如,我 阅读全文
posted @ 2011-04-16 10:32 super119 阅读(711) 评论(0) 推荐(0) 编辑
摘要:1. NIS是cs结构。NIS的所有data file(比如/etc/hosts, /etc/passwd等),被称作maps,也就是所有NIS server保留的信息被成为maps。client通过和NIS Server通讯从而得到这些maps。NIS Slave server本身也有maps,但是他们不能修改maps,他们只接受来自client的查询。NIS master server保存这maps的最新版本,且可以修改他们,一旦我们在master server上修改了maps,需要立刻通知slave server更新他们的maps,而对于client来说,它并不需要关心自己取来的maps 阅读全文
posted @ 2011-04-16 10:32 super119 阅读(189) 评论(0) 推荐(0) 编辑
摘要:1. gethostbyname -- 给定hostname,返回ip address。gethostbyaddr -- 给定IP,返回hostname。 2. 修改/etc/nsswitch.conf中hosts: files nis dns,可以定义gethostbyname, gethostbyaddr的行为,他们就会先找hosts文件,然后是NIS,最后是DNS。 3. 有关NIS+。1980年代的中期,sun开发了NIS。1992年,sun开发了NIS+,和NIS比起来,NIS+最大的特点就是安全性上做了很多增 强。所以,在众多的directory service中,如果安全性要求不 阅读全文
posted @ 2011-04-16 10:32 super119 阅读(146) 评论(0) 推荐(0) 编辑
摘要:本章介绍了一个heartbeat的最简单配置,以下是硬件上的连接图(附件1): 从图上可以看出,两台服务器使用以太网作为心跳线,分配的IP地址分别是10.1.1.1和10.1.1.2,BTW,在RFC1918中,规定可以用来做private network的IP地址为: 10.0.0.0 to 10.255.255.255 (10/8 prefix) 172.16.0.0 to 172.31.255.255 (172.16/12 prefix) 192.168.0.0 to 192.168.255.255 (192.168/16 prefix)2. 安装heartbeat软件包,用RPM的方式 阅读全文
posted @ 2011-04-16 10:31 super119 阅读(345) 评论(0) 推荐(0) 编辑
摘要:本章进一步讲解haresources文件的配置和heartbeat日常的维护问题。 1. /etc/ha.d/haresources文件中的每一行都将定义resource,每一行的书写语法是这样的: resource-owner-hostname [IPaddress] resource1[::arg1::arg2] [resource2[::arg1::arg2] 上面可以看到,第一列写的是拥有该项资源的primary server的hostname;然后第二列是一个可选项,如果填写的话,写的是IP Alias的IP地址,比如209.100.100.3上提供http服务,实际是由209.10 阅读全文
posted @ 2011-04-16 10:29 super119 阅读(318) 评论(0) 推荐(0) 编辑
摘要:1. 本章详细介绍stonith,当两台服务器都尝试要去接管资源的时候,就会出现split-brain的情况,当“心跳线”出现问题的时候,最容易出现这 种情况。这种情况是很致命的,他可能导致服务无法正常运行,更坏的是,有可能导致数据遭破坏,因为此时两台服务器都可能对一个数据源进行读写,这就很有可 能导致问题,就算两台服务器都只会写各自的存储设备,但也会导致两台服务器的存储内容不一致,所以这种情况要尽量避免,heartbeat给出的解决方案 就是--stonith 2. stonith要能正常执行,需要一定的硬件设备。该设备具有这样的特性,他可以连接在HA的两台服务器上(或连接在一台上也可),而 阅读全文
posted @ 2011-04-16 10:28 super119 阅读(400) 评论(0) 推荐(0) 编辑
摘要:从maillist上别人给出的答案可以看出,如果不做额外的工作,比如,那么heartbeat只有在收不到heartbeat package的时候才会failover,换言之,如果heartbeat的daemon工作正常,但是被监控的服务已经down掉 了,heartbeat也是不会做双机切换的。 需要作一些额外的工作,使得当被监控的服务出现问题时,heartbeat也会切换,如下: If you want to monitor the apache service with Heartbeat Release 1 then use Mon from Kernel.org to monitor 阅读全文
posted @ 2011-04-16 10:28 super119 阅读(397) 评论(0) 推荐(0) 编辑
摘要:1. 本章讲解概念,没有太多技术要点。 2. LVS-NAT Cluster. 这是一种基于LVS的load balance的集群构架方式。一堆服务器从一台NAT Server出去,所有的请求和返回信息都要经过NAT Server,所以这台NAT Server是瓶颈,后面会详细介绍。 3. LVS-DR Cluster. DR means "Direct Routing",这种LVS load balance集群,所有的请求经过一台服务器,调度到一堆服务器上之后,由这些服务器自动将response返回给客户端,所以称为direct routing。这样,那台服务器只经受了r 阅读全文
posted @ 2011-04-16 10:26 super119 阅读(239) 评论(0) 推荐(0) 编辑
摘要:1. 本章介绍LVS的一些相关概念,调度策略和集群架构类型。下一章开始讲解LVS-NAT集群 2. 从Linux内核2.4.23开始,加入了一个叫做IP Virtual Server(IPVS)的特性,这就使得我们可以把一台Linux机器作为一个load balancer来使用。LVS就是一个很好的构建Linux load balance集群的软件。 3. LVS Address Name Conventions. 这里介绍一下LVS中会提到的多种IP的专有名称,其实看图就明白了:见附件1 OK,从图上就能明白这些IP的意思了: Virtual IP (VIP) address The IP 阅读全文
posted @ 2011-04-16 10:25 super119 阅读(325) 评论(0) 推荐(0) 编辑
摘要:Here's an update to my initial attempt at an IPoIB FAQ: ping doesn't work between IPoIB nodes. What should I do ? First, verify that the ports are active. This can be done via: cat /sys/class/infiniband/mthca0/ports/1/state This should indicate 4: ACTIVE assuming the HCA is mthca0 and port 1 阅读全文
posted @ 2011-04-16 10:24 super119 阅读(980) 评论(0) 推荐(0) 编辑
摘要:找到了解释如下: Multi-rail support (multiple ports per adapter and multiple adapters) 看起来有点类似多网卡绑定或是单Infiniband网卡上的多Port绑定。但其实不是这样的,当然,多网卡绑定或者是多端口绑定会提升一部分 的带宽,但是这里的multi-rail不是这么单纯。其实multi-rail这个词本身不局限于Infiniband,以太网,Myrinet都可以 作 Multi-rail。 Multi-rail指的就是同时用多个网卡或是单块网卡上的多个port来同时通讯。目的有两个:第一,提高带宽,跨越带宽瓶颈。第二, 阅读全文
posted @ 2011-04-16 10:24 super119 阅读(694) 评论(0) 推荐(0) 编辑
摘要:很简单,比MaterialsStudio的License Server设置简单多了 1、ps aux|grep license 2、将上述信息中lmgrd的那一行拷贝下来,加到/etc/rc.d/rc.local中就OK了! 注意,ps信息中可能有两个进程(应该还有一个类似ansyslmd这样的东西),只需要将lmgrd加到/etc/rc.local就可以了, 因为lmgrd会负责启动ansyslmd这个进程的。看他们两的进程号就能看的出来,ansyslmd的pid总是比lmgrd的pid 大1,证明ansyslmd是lmgrd fork出来的。 阅读全文
posted @ 2011-04-16 10:23 super119 阅读(419) 评论(0) 推荐(0) 编辑
摘要:最近装了amd64版本的CFX10,发现一个问题 安装完成后,启动cfx5launcher都正常,但是在启动Solver求解一个example的时候,出现这样的错误:无法找到Partioner(无法对数据分块)?? 为了定位这样的问题,我决定先跑一下串行的看可不可以,跑了串行的之后问题定位出来了,串行的输出信息是: 无法在 /usr/local/CFX10/CFX-10.0/bin/linux 下找到solver-pvm.exe 于是来到/usr/local/CFX10/CFX-10.0/bin目录下查看,发现有一个目录叫linux-amd64,原来如此,新建一个linux的目录,将linux 阅读全文
posted @ 2011-04-16 10:23 super119 阅读(321) 评论(0) 推荐(0) 编辑
摘要:本次基于一台1个CPU的woodcrest 1.86GHz的机器,2G内存 1、BLAS用GotoBLAS,目前最新是1.10版,解开,然后编辑Makefile.rule,如下(这里没有列出的部分就是我没有修改的部分): # # Beginning of user configuration # # This library's version REVISION = -r1.10 # Which do you prefer to use for C compiler? Default is gcc. # I recommend you to use GCC because inline 阅读全文
posted @ 2011-04-16 10:22 super119 阅读(807) 评论(0) 推荐(0) 编辑
摘要:今天没事做了一个小测试。看看7.04比6.10性能强多少(其实只是对内核的测试而已)。 测试软件:super Pi linux原生版本。 测试内容:计算 super pi 104万位(2^20)。 测试硬件:Dothan 1.73GHz,1.5G RAM DDR533 Dual Channel。 测试系统:ubuntu 6.10 7.04 herd3(今日更新过) 测试条件:不进入gnome环境,只在控制台下,以确保测试的无干扰。 测试结果:6.10 37秒5,7.04 34秒。 另外做了windows xp下的同类型测试,44秒。 孰优孰劣,一目了然。 从这个角度讲,内核的更新还是很有意义的 阅读全文
posted @ 2011-04-16 10:19 super119 阅读(462) 评论(0) 推荐(0) 编辑
摘要:Intel Tools Training Notes 1. Intel Compiler general switches. 常用的命令option有: 0d: Disable optimizations. Zi: Creates Symbols. O1: Optimizes without increasing code size. O2: Default optimization switch. O3: Agressive optimization switches. 有时用O3会导致程序出错,无法编译等情况,有时用O3确实能提高速度,有时反而会降低速度,所以谨慎使用。 2. 高级的编译器 阅读全文
posted @ 2011-04-16 10:19 super119 阅读(354) 评论(0) 推荐(0) 编辑
摘要:CFX-10 (and it's service packs) comes with a bundled version of HP-MPI version. No extra license is required to use HP-MPI together with CFX. Just specify -start-method "HP MPI Distributed Parallel for x86 64" and HP-MPI automatically selects the fastest interconnect available. However 阅读全文
posted @ 2011-04-16 10:17 super119 阅读(1) 评论(0) 推荐(0) 编辑
摘要:FFTW 3.1.2的编译很简单了,有INSTALL文件可以参考 ./configure --prefix=/home/eric/fftw --enable-shared --enable-threads --enable-sse2 make make check make install --enable-shared最好加上,因为默认这个开关是关闭的,有些程序以-lfftw的方式来链接,所以这个开关要加,此外,如果要指定编译器和编译选项的话,这样: ./configure CC=xxx ...... 新版的configure都是这样指定编译器的,不再用环境变量了 这样就OK了很多科学软件其 阅读全文
posted @ 2011-04-16 10:15 super119 阅读(1556) 评论(0) 推荐(0) 编辑
摘要:Code: Select all program main parameter(Iout=12) character datim*26 open(Iout,file='file.out') CALL GDate(datim) write (Iout,*) 'Current time: ',datim(1:24) end Subroutine GDate(Date1) Implicit Integer(A-Z) Character*(*) Date1 Call FDate(Date1) If(Len(Date1).gt.24) Date1(25:) = ' 阅读全文
posted @ 2011-04-16 10:14 super119 阅读(308) 评论(0) 推荐(0) 编辑
摘要:很简单,用命令: mpirun_rsh -v 即可,输出类似: OSU MVAPICH VERSION 0.9.9-SingleRail Build-ID: custom 阅读全文
posted @ 2011-04-16 10:13 super119 阅读(200) 评论(0) 推荐(0) 编辑

上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 22 下一页