LSF 1-node 構成で LSF クラスタを構築 で作った lsf1 に、lsf2 を追加する

 

ネットワーク構成

lsf_network.png

[lsf2] 管理ユーザ lsfadmin の作成

# useradd -u 600 -g users lsfadmin
# id -a lsfadmin
uid=600(lsfadmin) gid=100(users) groups=100(users)

uid/gid はクラスタ全体で合わせる必要あり

[lsf2] アプリケーションの配備ディレクトリ /usr/share/lsf のマウント

[lsf2] 必要なライブラリのインストール

# yum install java-1.8.0-openjdk ed openssh-server openssh-clients

[lsf1/lsf2] root ユーザが相互にログインできるようにする

[root@lsf1 ~]# scp -r .ssh/ root@lsf2.local:/root/
[root@lsf1 ~]# ssh-keyscan lsf1.local lsf2.local > ~/.ssh/known_hosts
[root@lsf1 ~]# ssh lsf1.local
[root@lsf1 ~]# exit
[root@lsf1 ~]# ssh lsf2.local
[root@lsf2 ~]# exit
 
[root@lsf2 ~]# ssh-keyscan lsf1.local lsf2.local > ~/.ssh/known_hosts
[root@lsf2 ~]# ssh lsf1.local
[root@lsf1 ~]# exit
[root@lsf2 ~]# ssh lsf2.local
[root@lsf2 ~]# exit 

[lsf1] LSF cluster1 の再構築


[lsf1/lsf2] LSF が通信に使う port の解放

$ cat /usr/share/lsf/conf/lsf.conf | grep PORT
LSF_LIM_PORT=7869
LSF_RES_PORT=6878
LSB_MBD_PORT=6881
LSB_SBD_PORT=6882

を開放する

# firewall-cmd --add-port=7869/tcp --zone=public --permanent
# firewall-cmd --add-port=7869/udp --zone=public --permanent
# firewall-cmd --add-port=6878/tcp --zone=public --permanent
# firewall-cmd --add-port=6881/tcp --zone=public --permanent
# firewall-cmd --add-port=6882/tcp --zone=public --permanent
# firewall-cmd --reload

mbatch が有効な場合には 6891/tcp も開放する必要がある。mbatch が有効なときには lsf.conf に LSB_QUERY_PORT=6891 が記載される。

[lsf1] 起動・動作確認

# . /usr/share/lsf/conf/profile.lsf 
# lsfstartup 
Starting up all LIMs ...
Do you really want to start up LIM on all hosts ? [y/n]y
Start up LIM on <lsf1.local> ...... done
Start up LIM on <lsf2.local> ...... done

Waiting for Master LIM to start up ...  Master LIM is ok
Starting up all RESes ...
Do you really want to start up RES on all hosts ? [y/n]y
Start up RES on <lsf1.local> ...... done
Start up RES on <lsf2.local> ...... done

Starting all slave daemons on LSBATCH hosts ...
Do you really want to start up slave batch daemon on all hosts ? [y/n] y
Start up slave batch daemon on <lsf1.local> ...... done
Start up slave batch daemon on <lsf2.local> ...... done

Done starting up LSF daemons on the local LSF cluster ... 
 
# lsid
IBM Spectrum LSF Community Edition 10.1.0.0, Jun 15 2016
Copyright IBM Corp. 1992, 2016. All rights reserved.
US Government Users Restricted Rights - Use, duplication or disclosure restricted by
GSA ADP Schedule Contract with IBM Corp.

My cluster name is cluster1
My master name is lsf1

# lshosts 
HOST_NAME      type    model  cpuf ncpus maxmem maxswp server RESOURCES
lsf1         X86_64   PC6000 116.1     2  1023M   1.9G    Yes (mg)
lsf2.local   X86_64   PC6000 116.1     1  1023M   1.9G    Yes (mg)

# bhosts
HOST_NAME          STATUS       JL/U    MAX  NJOBS    RUN  SSUSP  USUSP    RSV 
lsf1               ok              -      2      0      0      0      0      0
lsf2.local         ok              -      1      0      0      0      0      0

LSF


添付ファイル: filelsf_network.png 6件 [詳細]

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS   sitemap
Last-modified: 2017-12-05 (火) 02:13:40 (11d)
ISBN10
ISBN13
9784061426061