OS:Ubuntu 16.04 LTS
GPU:GeForce GTX TITAN X3枚
のマシンをホストとしてnvidia-docker上でコンテナを管理しています。
以前は機械学習の実験をしており、コンテナ上でスクリプト等を動作させていました。
先日、トラブルが発生しサーバー管理者からnvidiaドライバーをアップグレードしたとの連絡があり、サーバーが再起動されていました。
そこで、いつものように作業を再開するためにnvidia-docker restart [コンテナID]
でこれまで作業していたコンテナを立ち上げようとしたらエラーが発生しました。
docker: Error response from daemon: create nvidia_driver_396.37: Error looking up volume plugin nvidia-docker: legacy plugin: Post http://%2Fvar%2Flib%2Fnvidia-docker%2Fnvidia-docker.sock/Plugin.Activate: dial unix /var/lib/nvidia-docker/nvidia-docker.sock: connect: connection refused. See 'docker run --help'.
おかしいと思い、以前docker commit [コンテナID]
によって保存していたイメージからnvidia-docker run
コマンドを実行しようとしても上記と同様のエラーが発生しました。
以前dockerhubにバックアップしておいたイメージをpullしてもコンテナ作成はうまく行きませんでした。
Dockerfileではなくイメージ内でかなりの環境構築を行なっていたので、可能であればこのままのイメージで作業を再開したいと考えています。
この推測が正しいかどうかも分かりませんが、ホストのコンテナ内のnvidiaドライバーが違うからなのかと考えましたが、コンテナ及びイメージで使用するnvidiaドライバーをアップグレードする方法はわかりませんでした。
nvidiaドライバーやnvidia dockerに詳しい方、何かご教授いただければ幸いです。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/07/19 03:00