質問編集履歴

1

snapによるslurmインストール後の状況

2020/09/15 03:02

投稿

kak
kak

スコア28

test CHANGED
@@ -1 +1 @@
1
- slurmでのエラー Unable to contact slurm controller (connect failure)
1
+ slurmでのエラー snapを利用したsytemctlについて
test CHANGED
@@ -21,3 +21,91 @@
21
21
 
22
22
 
23
23
  どこを確認したらいいのでしょうか。
24
+
25
+
26
+
27
+ (2020.9.15追記)
28
+
29
+ https://snapcraft.io/install/slurm/centos
30
+
31
+ よりsnap経由でslurmをインストールできました。
32
+
33
+
34
+
35
+ ```ここに言語を入力
36
+
37
+ (kak) [kaku ~]$ ls -l /etc/systemd/system/
38
+
39
+ -rw-r--r-- 1 root root 480 Sep 15 11:28 snap.slurm.munged.service
40
+
41
+ -rw-r--r-- 1 root root 531 Sep 15 11:28 snap.slurm.mysql.service
42
+
43
+ -rw-r--r-- 1 root root 497 Sep 15 11:28 snap.slurm.slurmctld.service
44
+
45
+ -rw-r--r-- 1 root root 494 Sep 15 11:28 snap.slurm.slurmdbd.service
46
+
47
+ -rw-r--r-- 1 root root 488 Sep 15 11:28 snap.slurm.slurmd.service
48
+
49
+ -rw-r--r-- 1 root root 500 Sep 15 11:28 snap.slurm.slurmrestd.service
50
+
51
+ ```
52
+
53
+ と、snap.slurm以下にslurm関連のサービスが出来ました。
54
+
55
+
56
+
57
+ ```ここに言語を入力
58
+
59
+ (kak) [kak ~]$ systemctl status snap.slurm.slurmd.service
60
+
61
+ ● snap.slurm.slurmd.service - Service for snap application slurm.slurmd
62
+
63
+ Loaded: loaded (/etc/systemd/system/snap.slurm.slurmd.service; enabled; vendor preset: disabled)
64
+
65
+ Active: inactive (dead) since Tue 2020-09-15 11:41:20 JST; 6s ago
66
+
67
+ Process: 482467 ExecStart=/usr/bin/snap run slurm.slurmd (code=exited, status=0/SUCCESS)
68
+
69
+ Main PID: 482467 (code=exited, status=0/SUCCESS)
70
+
71
+ ```
72
+
73
+
74
+
75
+ ```ここに言語を入力
76
+
77
+ (kak) [kak ~]$ systemctl status snap.slurm.slurmctld.service
78
+
79
+ ● snap.slurm.slurmctld.service - Service for snap application slurm.slurmctld
80
+
81
+ Loaded: loaded (/etc/systemd/system/snap.slurm.slurmctld.service; enabled; vendor preset: disabled)
82
+
83
+ Active: inactive (dead) since Tue 2020-09-15 11:28:35 JST; 13min ago
84
+
85
+ Main PID: 481371 (code=exited, status=0/SUCCESS)
86
+
87
+ ```
88
+
89
+
90
+
91
+ それぞれ動作は順調のようです。
92
+
93
+ しかし、
94
+
95
+
96
+
97
+ ```ここに言語を入力
98
+
99
+ (kak) [kak ~]$ sinfo
100
+
101
+ slurm_load_partitions: Unable to contact slurm controller (connect failure)
102
+
103
+ ```
104
+
105
+ やはりsinfoでslurmの状況を見ようとするとエラーが出ます。
106
+
107
+ 表現が合っているか分かりませんが、snap.slurm以下に作成されたサービスをslurmとして動作?させるにはどうしたらいいでしょうか。
108
+
109
+ https://github.com/omnivector-solutions/snap-slurm
110
+
111
+ このサイトでは普通に動いているようなのですが。