SGE (Son of Grid Engine) exec_host の追加 on Red Hat linux 7.9

これまでクラスター内でSGEを用いて計算ジョブを実行してきた。

別の場所の計算機にもmount.cifsでQNAPのディスクをマウントした。この計算機(Red hat linux 7.9)にもジョブをSGEで投入したい。できればqmasterは既存のクラスター内のものを使いたい。手順は以下の通り:

 

1. qmaster上で新しいexec_hostを追加

qconf -ah 新しいexec_hostの名前

2. 新しいexec_hostに既存のsgeのディレクトリ(今回は/usr/sge)をまるごとtarでもってくる。

3. 新しいexec_hostでinstall_execdを実行。適当に答えていけばデーモンも自動起動するようになる。

4. 自分の場合、queueは一つのみで、特に新たな並列環境を作ることもなく、新しいexec_hostはスクリプト上で指定できる

#$ -q queueの名前.q@exec_hostの名前

 

mount.cifsでホームディレクトリごと別の場所(/mount/XXX)マウントしているので、計算ディレクトリ(を同じ形に見えるようにシンボリックリンクを張る。

ln -s /mount/XXX/WWW  /home/ZZZ/WWW

わかりにくいが、XXXはホームディレクトリのマウントポイント、WWWは計算ディレクトリ、ZZZはホームディレクトリの名前。

これで、特に新しいexec_hostにssh等でログインしなくても計算が実行できる。当然、計算プログラムはクラスターのものと同様のものが動かなければいけない。