这是一个非常简单的建造四节点的小集群系统的例子,它是构建在Linux操作系统上,通过MPICH软件包实现的,希望这个小例子能让大家对集群系统的构建有一个最基本的了解。
2.使用MPICH构建一个四节点的集群系统
这是一个非常简单的建造四节点的小集群系统的例子,它是构建在Linux操作系统上,通过MPICH软件包实现的,希望这个小例子能让大家对集群系统的构建有一个最基本的了解。
2.1 所需设备
1).4台采用Pentium II处理器的PC机,每台配
置64M内存,2GB以上的硬盘,和EIDE接口的光盘驱动器。
2).5块100M快速以太网卡,如SMC 9332 EtherPower 10/100(其中四块卡用于连接集群中的结点,另外一块用于将集群中的其中的一个节点与其它网络连接。)
3).5根足够连接集群系统中每个节点的,使用5类非屏蔽双绞线制作的RJ45缆线
4).1个快速以太网(100BASE-Tx)的集线器或交换机
5).1张Linux安装盘
2.2 构建说明
对计算机硬件不熟的人,实施以下这些构建步骤会感到吃力。如果是这样,请找一些有经验的专业人士寻求帮助。
1. 准备好要使用的采用Pentium II处理器的PC机。确信所有的PC机都还没有接上电源,打开PC机的机箱,在准备与网络上的其它设备连接的PC机上安装上两块快速以太网卡,在其它的 PC机上安装上一块快速以太网卡。当然别忘了要加上附加的内存。确定完成后盖上机箱,接上电源。
2. 使用4根RJ45线缆将四台PC机连到快速以太网的集线器或交换机上。使用剩下的1根RJ45线将额外的以太网卡(用于与其它网络相连的那块,这样机构就可以用上集群)连接到机构的局域网上(假定你的机构局域网也是快速以太网),然后打开电源。
3. 使用LINUX安装盘在每一台PC机上安装。请确信在LINUX系统中安装了C编译器和C的LIB库。当你配置TCP/IP时,建议你为四台PC分别指定为192.168.1.1、192.168.1.2、192.168.1.3、192.168.1.4。第一台PC为你的服务器节点(拥有两块网卡的那台)。在这个服务器节点上的那块与机构局域网相连的网卡,你应该为其指定一个与机构局域网吻合的IP地址。
4.当所有PC都装好Linux系统后,编辑每台机器的/etc/hosts文件,让其包含以下几行:
192.168.1.1 node1 server
192.168.1.2 node2
192.168.1.3 node3
192.168.1.4 node4
编辑每台机器的/etc/hosts.equiv文件,使其包含以下几行:
node1
node2
node3
node4
$p#
以下的这些配置是为了让其能使用MPICH’s p4策略去执行分布式的并行处理应用。
1. 在服务器节点
,建一个/mirror目录,并将其配置成为NFS服务器,并在/etc/exports文件中增加一行:
/mirror node1(rw) node2(rw) node3(rw) node4(rw)
2. 在其他节点上,也建一个/mirror目录,关在/etc/fstab文件中增加一行:
server:/mirror /mirror nfs rw,bg,soft 0 0
3. /mirror这个目录从服务器上输出,装载在各个客户端,以便在各个节点间进行软件任务的分发。
4. 在服务器节点上,安装MPICH。MPICH的文档可在
5.任何一个集群用户(你必须在每一个节点新建一个相同的用户),必须在/mirror目录下建一个属于它的子目录,如 /mirror/username,用来存放MPI程序和共享数据文件。这种情况,用户仅仅需要在服务器节点上编译MPI程序,然后将编译后的程序拷贝到在/mirror目录下属于它的的子目录中,然后从他在/mirror目录下属于它的的子目录下使用p4 MPI策略运行MPI程序。
以在Windows Server 2003系统中安装配置群集服务为例介绍方法:
第1步,依次单击“开始”→“所有程序”→“管理工具”→“群集管理器”菜单,打开“群集管理器”窗口,并自动打开“打开到群集的连接”对话框。这个对话框为用户提供了创建新群集、添加节点到群集和打开到群集的连接三个选项。在“操作”下拉菜单中选择“创建新群集”命令并单击“确定”按钮。
第2步,打开“新建服务器群集向导”,在欢迎向导页中单击“下一步”按钮。在打开的“群集名称和域”向导页中输入一个群集名称,且该名称必须是有效的计算机名称。另外需要选择一个域名,新的群集将创建在这个域中。采用默认域名,单击“下一步”按钮。
第3步,在打开的“请选择计算机”向导页中提示用户输入将要安装新群集的第一个节点计算机,默认情况下将自动选择本地服务器。单击“下一步”按钮。
单击“高级”按钮并选中“高级(最小)配置”复选框后,则在“新建服务器群集向导”完成最后的步骤后需要手动添加共享设备。
第4步,接着“新建服务器群集向导”将使用用户提供的信息来分析所有为了成功创建群集所必需的因素。向导主要通过以下五个方面进行分析:
(1)检验现有群集:验证网络上不存在具有相同名称的群集;
(2)建立节点连接:连接到目标服务器并初始化群集创建过程;
(3)检验节点可行性:确定目标服务器是否满足所有的先决条件;
(4)查找节点上的公共资源:确定共享资源的可用性,包括列举共享磁盘资源(为了创建仲裁)和网络适配器(为了安装群集网络);
(5)检验群集可行性:验证群集的创建是可能的并为仲裁指定资源。
向导将用对勾表示成功,用叉号表示失败,而带有叹号的黄色三角形表示警告,其中警告标识可以忽略。如果分析中任何一个方面存在问题,则必须清除故障后才能继续操作。通过分析验证后单击“下一步”按钮。
第5步,打开“IP地址”向导页,这时需要设置群集的IP地址。该地址将作为DNS解析群集名称时的目标地址,且该地址应该跟“公用连接”的IP地址处于同一个网段。本例中输入该网段中一个空闲的IP地址10.115.1.168。设置完毕单击“下一步”按钮。
第6步,在打开的“群集服务账户”向导页中需要提供一个域用户账户,以便对群集进行管理。这个账户将被放在本地管理员组(Administrators)中,并被赋予在目标服务器上的适当权限。这里输入前面创建的群集用户账户Cluster和其密码,并单击“下一步”按钮。
第7步,打开“建议的群集配置”向导页,在该向导页中列出了到目前为止用户设置的所有信息。确认无误后单击“下一步”按钮。
第8步,向导开始创建并启动服务器群集,这个过程被分成了4个主要部分:
(1)重新分析群集:重复原先在检验群集可行性时选择的步骤。一旦这种可行性被验证,群集配置就已经初始化了;
(2)配置群集服务:将群集服务账户分配到合适的组,并赋予其合适的用户权利。然后创建并启动与群集有关的服务、创建并配置群集数据库以及创建并启动Cluster Service(群集服务);
(3)配置资源类型:配置Generic Script和Majority Node Set资源类型;
(4)配置资源:创建、配置并启动群集组中的资源(包括仲裁资源)。
创建完毕单击“下一步”按钮。
群集服务安装完毕以后会自动连接到群集。
如果由于配置错误导致无法连接到群集而需要取消群集配置时,可以在“命令提示符”窗口中输入命令行“cluster node 节点名称 /forcecleanup”并按回车键来实现。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)