質問編集履歴

6

確認事項追記

2021/08/05 05:22

投稿

MagMag
MagMag

スコア80

test CHANGED
File without changes
test CHANGED
@@ -72,7 +72,7 @@
72
72
 
73
73
  ```bash
74
74
 
75
- docker run -it --gpus all tensor_image /bin/bash
75
+ $ docker run -it --gpus all tensor_image /bin/bash
76
76
 
77
77
  ```
78
78
 
@@ -144,7 +144,7 @@
144
144
 
145
145
  ```bash
146
146
 
147
- echo $LD_LIBRARY_PATH
147
+ $ echo $LD_LIBRARY_PATH
148
148
 
149
149
  # /usr/local/nvidia/lib:/usr/local/nvidia/lib64
150
150
 
@@ -157,3 +157,47 @@
157
157
  # libcuda.so.1 (libc6,x86-64) => /usr/lib/x86_64-linux-gnu/libcuda.so.1
158
158
 
159
159
  ```
160
+
161
+
162
+
163
+ ### バージョン等確認
164
+
165
+ ```bash
166
+
167
+ # ホスト
168
+
169
+ $ docker —version
170
+
171
+ Docker version 20.10.7, build f0df350
172
+
173
+
174
+
175
+ # ホスト
176
+
177
+ $ nvidia-container-cli info
178
+
179
+ NVRM version: 430.64
180
+
181
+ CUDA version: 10.1
182
+
183
+ GPU認識されているが省略
184
+
185
+
186
+
187
+ # ホスト
188
+
189
+ $ ls -lh /usr/lib/x86_64-linux-gnu/libcuda.so*
190
+
191
+ ls: '/usr/lib/x86_64-linux-gnu/libcuda.so*' にアクセスできません: そのようなファイルやディレクトリはありません
192
+
193
+
194
+
195
+ # コンテナ
196
+
197
+ $ ls -lh /usr/lib/x86_64-linux-gnu/libcuda.so*
198
+
199
+ lrwxrwxrwx 1 root root 18 Aug 5 05:21 /usr/lib/x86_64-linux-gnu/libcuda.so.1 -> libcuda.so.410.129
200
+
201
+ -rw-r--r-- 1 root root 15M Aug 14 2019 /usr/lib/x86_64-linux-gnu/libcuda.so.410.129
202
+
203
+ ```

5

確認事項追記

2021/08/05 05:22

投稿

MagMag
MagMag

スコア80

test CHANGED
File without changes
test CHANGED
@@ -23,6 +23,10 @@
23
23
  - ホストコンピュータ上でもコンテナ上でもnvidia-smiコマンドは通り、共にドライバは430.64で認識されます。
24
24
 
25
25
  - nvidiaドライバ、cuda、tensorflow、pythonのバージョンを合わせて導入したつもりです。
26
+
27
+ - GPU利用可能なTensoflowのイメージを利用しても問題が再現しました。
28
+
29
+ - GPUはGeFroce GTX 1080Ti(4枚)となります。
26
30
 
27
31
 
28
32
 

4

調査コマンド追加

2021/08/05 01:25

投稿

MagMag
MagMag

スコア80

test CHANGED
File without changes
test CHANGED
@@ -133,3 +133,23 @@
133
133
  # ]
134
134
 
135
135
  ```
136
+
137
+
138
+
139
+ ### コンテナ内でのライブラリパス確認
140
+
141
+ ```bash
142
+
143
+ echo $LD_LIBRARY_PATH
144
+
145
+ # /usr/local/nvidia/lib:/usr/local/nvidia/lib64
146
+
147
+
148
+
149
+ ldconfig -p | grep libcuda
150
+
151
+ # libcudart.so.10.0 (libc6,x86-64) => /usr/local/cuda-10.0/targets/x86_64-linux/lib/libcudart.so.10.0
152
+
153
+ # libcuda.so.1 (libc6,x86-64) => /usr/lib/x86_64-linux-gnu/libcuda.so.1
154
+
155
+ ```

3

誤字修正

2021/08/05 01:20

投稿

MagMag
MagMag

スコア80

test CHANGED
File without changes
test CHANGED
@@ -22,7 +22,7 @@
22
22
 
23
23
  - ホストコンピュータ上でもコンテナ上でもnvidia-smiコマンドは通り、共にドライバは430.64で認識されます。
24
24
 
25
- - nvidiaドライバ、cuda、tensorflow、tensorflowのバージョンを合わせて導入したつもりです。
25
+ - nvidiaドライバ、cuda、tensorflow、pythonのバージョンを合わせて導入したつもりです。
26
26
 
27
27
 
28
28
 

2

表題変更

2021/08/04 09:41

投稿

MagMag
MagMag

スコア80

test CHANGED
@@ -1 +1 @@
1
- Docker+GPU+TensorFlow環境構築において、GPUを認識しない(Nvidiaドライバの不一致?)
1
+ Docker+GPU+TensorFlow環境構築において、GPUを認識しない(なぜかNvidiaドライバが2つ出現?)
test CHANGED
File without changes

1

表題わかりやすくした。

2021/08/04 07:10

投稿

MagMag
MagMag

スコア80

test CHANGED
@@ -1 +1 @@
1
- Docker+GPU+TensorFlow環境構築において、Nvidiaドライバの不一致が起きる
1
+ Docker+GPU+TensorFlow環境構築において、GPUを認識しない(Nvidiaドライバの不一致?)
test CHANGED
File without changes