お世話になります。
Centos8にAnacondaでPython3.8の仮想環境を作り、
conda install -c brown-data-science slurm
を入れたのですが、
(kak) [kak]$ sinfo slurm_load_partitions: Unable to contact slurm controller (connect failure)
というエラーが出ます。
slumctld, slurmd, slurmdbd, slurmrestdなどの場所は確認しパスを通しました。
どこを確認したらいいのでしょうか。
(2020.9.15追記)
https://snapcraft.io/install/slurm/centos
よりsnap経由でslurmをインストールできました。
(kak) [kaku ~]$ ls -l /etc/systemd/system/ -rw-r--r-- 1 root root 480 Sep 15 11:28 snap.slurm.munged.service -rw-r--r-- 1 root root 531 Sep 15 11:28 snap.slurm.mysql.service -rw-r--r-- 1 root root 497 Sep 15 11:28 snap.slurm.slurmctld.service -rw-r--r-- 1 root root 494 Sep 15 11:28 snap.slurm.slurmdbd.service -rw-r--r-- 1 root root 488 Sep 15 11:28 snap.slurm.slurmd.service -rw-r--r-- 1 root root 500 Sep 15 11:28 snap.slurm.slurmrestd.service
と、snap.slurm以下にslurm関連のサービスが出来ました。
(kak) [kak ~]$ systemctl status snap.slurm.slurmd.service ● snap.slurm.slurmd.service - Service for snap application slurm.slurmd Loaded: loaded (/etc/systemd/system/snap.slurm.slurmd.service; enabled; vendor preset: disabled) Active: inactive (dead) since Tue 2020-09-15 11:41:20 JST; 6s ago Process: 482467 ExecStart=/usr/bin/snap run slurm.slurmd (code=exited, status=0/SUCCESS) Main PID: 482467 (code=exited, status=0/SUCCESS)
(kak) [kak ~]$ systemctl status snap.slurm.slurmctld.service ● snap.slurm.slurmctld.service - Service for snap application slurm.slurmctld Loaded: loaded (/etc/systemd/system/snap.slurm.slurmctld.service; enabled; vendor preset: disabled) Active: inactive (dead) since Tue 2020-09-15 11:28:35 JST; 13min ago Main PID: 481371 (code=exited, status=0/SUCCESS)
それぞれ動作は順調のようです。
しかし、
(kak) [kak ~]$ sinfo slurm_load_partitions: Unable to contact slurm controller (connect failure)
やはりsinfoでslurmの状況を見ようとするとエラーが出ます。
表現が合っているか分かりませんが、snap.slurm以下に作成されたサービスをslurmとして動作?させるにはどうしたらいいでしょうか。
https://github.com/omnivector-solutions/snap-slurm
このサイトでは普通に動いているようなのですが。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。