質問編集履歴
6
確認事項追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -72,7 +72,7 @@
|
|
72
72
|
|
73
73
|
```bash
|
74
74
|
|
75
|
-
docker run -it --gpus all tensor_image /bin/bash
|
75
|
+
$ docker run -it --gpus all tensor_image /bin/bash
|
76
76
|
|
77
77
|
```
|
78
78
|
|
@@ -144,7 +144,7 @@
|
|
144
144
|
|
145
145
|
```bash
|
146
146
|
|
147
|
-
echo $LD_LIBRARY_PATH
|
147
|
+
$ echo $LD_LIBRARY_PATH
|
148
148
|
|
149
149
|
# /usr/local/nvidia/lib:/usr/local/nvidia/lib64
|
150
150
|
|
@@ -157,3 +157,47 @@
|
|
157
157
|
# libcuda.so.1 (libc6,x86-64) => /usr/lib/x86_64-linux-gnu/libcuda.so.1
|
158
158
|
|
159
159
|
```
|
160
|
+
|
161
|
+
|
162
|
+
|
163
|
+
### バージョン等確認
|
164
|
+
|
165
|
+
```bash
|
166
|
+
|
167
|
+
# ホスト
|
168
|
+
|
169
|
+
$ docker —version
|
170
|
+
|
171
|
+
Docker version 20.10.7, build f0df350
|
172
|
+
|
173
|
+
|
174
|
+
|
175
|
+
# ホスト
|
176
|
+
|
177
|
+
$ nvidia-container-cli info
|
178
|
+
|
179
|
+
NVRM version: 430.64
|
180
|
+
|
181
|
+
CUDA version: 10.1
|
182
|
+
|
183
|
+
GPU認識されているが省略
|
184
|
+
|
185
|
+
|
186
|
+
|
187
|
+
# ホスト
|
188
|
+
|
189
|
+
$ ls -lh /usr/lib/x86_64-linux-gnu/libcuda.so*
|
190
|
+
|
191
|
+
ls: '/usr/lib/x86_64-linux-gnu/libcuda.so*' にアクセスできません: そのようなファイルやディレクトリはありません
|
192
|
+
|
193
|
+
|
194
|
+
|
195
|
+
# コンテナ
|
196
|
+
|
197
|
+
$ ls -lh /usr/lib/x86_64-linux-gnu/libcuda.so*
|
198
|
+
|
199
|
+
lrwxrwxrwx 1 root root 18 Aug 5 05:21 /usr/lib/x86_64-linux-gnu/libcuda.so.1 -> libcuda.so.410.129
|
200
|
+
|
201
|
+
-rw-r--r-- 1 root root 15M Aug 14 2019 /usr/lib/x86_64-linux-gnu/libcuda.so.410.129
|
202
|
+
|
203
|
+
```
|
5
確認事項追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -23,6 +23,10 @@
|
|
23
23
|
- ホストコンピュータ上でもコンテナ上でもnvidia-smiコマンドは通り、共にドライバは430.64で認識されます。
|
24
24
|
|
25
25
|
- nvidiaドライバ、cuda、tensorflow、pythonのバージョンを合わせて導入したつもりです。
|
26
|
+
|
27
|
+
- GPU利用可能なTensoflowのイメージを利用しても問題が再現しました。
|
28
|
+
|
29
|
+
- GPUはGeFroce GTX 1080Ti(4枚)となります。
|
26
30
|
|
27
31
|
|
28
32
|
|
4
調査コマンド追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -133,3 +133,23 @@
|
|
133
133
|
# ]
|
134
134
|
|
135
135
|
```
|
136
|
+
|
137
|
+
|
138
|
+
|
139
|
+
### コンテナ内でのライブラリパス確認
|
140
|
+
|
141
|
+
```bash
|
142
|
+
|
143
|
+
echo $LD_LIBRARY_PATH
|
144
|
+
|
145
|
+
# /usr/local/nvidia/lib:/usr/local/nvidia/lib64
|
146
|
+
|
147
|
+
|
148
|
+
|
149
|
+
ldconfig -p | grep libcuda
|
150
|
+
|
151
|
+
# libcudart.so.10.0 (libc6,x86-64) => /usr/local/cuda-10.0/targets/x86_64-linux/lib/libcudart.so.10.0
|
152
|
+
|
153
|
+
# libcuda.so.1 (libc6,x86-64) => /usr/lib/x86_64-linux-gnu/libcuda.so.1
|
154
|
+
|
155
|
+
```
|
3
誤字修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -22,7 +22,7 @@
|
|
22
22
|
|
23
23
|
- ホストコンピュータ上でもコンテナ上でもnvidia-smiコマンドは通り、共にドライバは430.64で認識されます。
|
24
24
|
|
25
|
-
- nvidiaドライバ、cuda、tensorflow、t
|
25
|
+
- nvidiaドライバ、cuda、tensorflow、pythonのバージョンを合わせて導入したつもりです。
|
26
26
|
|
27
27
|
|
28
28
|
|
2
表題変更
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
Docker+GPU+TensorFlow環境構築において、GPUを認識しない(Nvidiaドライバ
|
1
|
+
Docker+GPU+TensorFlow環境構築において、GPUを認識しない(なぜかNvidiaドライバが2つ出現?)
|
test
CHANGED
File without changes
|
1
表題わかりやすくした。
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
Docker+GPU+TensorFlow環境構築において、Nvidiaドライバの不一致
|
1
|
+
Docker+GPU+TensorFlow環境構築において、GPUを認識しない(Nvidiaドライバの不一致?)
|
test
CHANGED
File without changes
|