ChainerでマルチGPU化をしようと思い、既存のコードを改変しGPU9台で学習できるようにしました。が、自作で組み立てたUbuntuマシンがmpirun
コマンドを実行するとシグナル9で強制停止してしまいます。
mpirun
1
↑エラーメッセージ
ちょっと調べて見るとメモリが足りないうんちゃらという感じで若干情報はヒットするのですが、いかんせん対応方法がわかりません。
もし、少しでも知見がある方いらしゃればご教授いただければ幸いです。
以下環境です
Ubuntu16.04
Chainer 3.5.0
ChainerMN 1.2.0
cupy 2.4.0
Cython 0.28.2
CUDA 8.0
以下参考にしたサイトです
ネットに落ちてたchainerコードをchainermn対応させて使っています。
リンク内容
↑競馬予想ニューラルネット
リンク内容
↑chainerMNのQiita記事
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/06/23 16:32 編集
2018/06/23 17:14
2018/06/23 17:37
2018/06/24 15:10