質問編集履歴
2
タイトルの修正
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
Anacondaで構築したtensorflow-gpuが動かない
|
1
|
+
Anacondaで再構築したtensorflow-gpuが動かない
|
test
CHANGED
File without changes
|
1
誤って前の保存内容を上げてしまった修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -4,7 +4,7 @@
|
|
4
4
|
|
5
5
|
1週間ほど前にAnacondaのGPUが効かなくなったため、環境構築のやり直しを行いました。
|
6
6
|
|
7
|
-
GPUに必要なTensorflow, CUDA, cuDNN, MSVC等入れなおしましたが
|
7
|
+
そして、GPUに必要なTensorflow, CUDA, cuDNN, MSVC等入れなおしましたが効きませんでした。
|
8
8
|
|
9
9
|
原因にお心当たりのある方にご教授いただければ幸いです。
|
10
10
|
|
@@ -92,13 +92,13 @@
|
|
92
92
|
|
93
93
|
## google colabで試してみるも、容量やメモリの関係で断念
|
94
94
|
|
95
|
-
GPUさえ使えればいいので、以前使用していたgoogle colabでやろうと考えました。しかし、50GB以上学習に必要
|
95
|
+
GPUさえ使えればいいので、以前使用していたgoogle colabでやろうと考えました。しかし、50GB以上学習に必要な上、メモリも8G程度では足りないことから現実的でないと断念しました。
|
96
96
|
|
97
97
|
|
98
98
|
|
99
99
|
## バージョンに原因があるかも?と思い、環境再構築へ
|
100
100
|
|
101
|
-
GPUが効かなくなってから改めて
|
101
|
+
GPUが効かなくなってから改めてTensorflowが公表しているGPU環境のバージョン対応を調べたところ、誤って[Linuxのバージョン対応表](https://www.tensorflow.org/install/source?hl=ja)に準拠していたことが判明しました。次の画像の選択部分が**以前構築していたバージョン**です。
|
102
102
|
|
103
103
|
![Linuxのバージョン対応表](ff787c113ef5df5ee1b7e0627bd69a8a.png)
|
104
104
|
|
@@ -106,7 +106,7 @@
|
|
106
106
|
|
107
107
|
![windowsのバージョン対応表](53b1177e20441316779f500d793dec36.png)
|
108
108
|
|
109
|
-
元々、1つ上のtensorflow-gpu2.1.0で検討していたのですが、cuDNN7.4にCUDA10.1に対応するバージョンが存在しなかった(※)ため、2.0.0で行いました。
|
109
|
+
元々、1つ上の``tensorflow-gpu2.1.0``で検討していたのですが、``cuDNN7.4``に``CUDA10.1``に対応するバージョンが存在しなかった(※)ため、2.0.0で行いました。
|
110
110
|
|
111
111
|
|
112
112
|
|
@@ -146,90 +146,28 @@
|
|
146
146
|
|
147
147
|
# cuDNN7.6→7.4
|
148
148
|
|
149
|
+
cuDNNをダウンロード・展開し、``C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0``の各ディレクトリの該当ファイルを上書きしました。システム環境変数についても設定済みです。[こちら](https://www.kkaneko.jp/tools/win/cudnn.html)のサイトを参考にしました。
|
150
|
+
|
151
|
+
pathの確認結果は次の画像の通りです。
|
152
|
+
|
153
|
+
![pathの確認](c4e84c497a855ed63f26fbf72b8afb4d.png)
|
154
|
+
|
155
|
+
(パスが該当サイトと少し違ったので、「試したこと」で検証しました。)
|
156
|
+
|
149
157
|
|
150
158
|
|
151
159
|
# Python3.7→3.6, Tensorflow2.1.0→2.0.0
|
152
160
|
|
153
|
-
|
154
|
-
|
155
|
-
|
156
|
-
|
157
|
-
### 問題発生までに行ったこと
|
158
|
-
|
159
|
-
##CUDAダウングレードに至った経緯
|
160
|
-
|
161
|
-
|
162
|
-
|
163
|
-
|
164
|
-
|
165
|
-
![Linuxのバージョン対応表](ff787c113ef5df5ee1b7e0627bd69a8a.png)
|
166
|
-
|
167
|
-
[windowsのバージョン対応表](https://www.tensorflow.org/install/source_windows?hl=ja)は次の通りでした。選択部分が今回構築しようとしているバージョンです。
|
168
|
-
|
169
|
-
![windowsのバージョン対応表](53b1177e20441316779f500d793dec36.png)
|
170
|
-
|
171
|
-
元々、1つ上のtensorflow-gpu2.1.0で検討していたのですが、cuDNN7.4にCUDA10.1に対応するバージョンが存在しなかったため、2.0.0で行いました。
|
172
|
-
|
173
|
-
|
174
|
-
|
175
|
-
## 環境再構築方法
|
176
|
-
|
177
|
-
変更したのは、MSVC2019→1017、CUDA10.1→10.0です。(CUDAが不具合のため、cuDNN・Python・tensorflowはまだです。)
|
178
|
-
|
179
|
-
|
180
|
-
|
181
|
-
# MSVC2019→1017
|
182
|
-
|
183
|
-
2019は消さずに2017を追加する形で変更しました。
|
184
|
-
|
185
|
-
|
186
|
-
|
187
|
-
# CUDA10.1→10.0
|
188
|
-
|
189
|
-
アンインストールとインストールの作業の流れは以下の通りです。
|
190
|
-
|
191
|
-
1. 10.0をインストール →しかし10.1と共存してしまう。CUDAも動作せず
|
192
|
-
|
193
|
-
2. 10.1をアンインストール(方法は後に説明)→CUDA動作せず
|
194
|
-
|
195
|
-
3. 10.0もアンインストール
|
196
|
-
|
197
|
-
4. 10.0をインストール →CUDA動作せず
|
198
|
-
|
199
|
-
|
200
|
-
|
201
|
-
アンインストールは2つの方法で行いました。
|
202
|
-
|
203
|
-
- コントロールパネルからNVIDIA関連のプログラムを消去
|
204
|
-
|
205
|
-
(具体的には、NVIDIA関連の中でも**インストール日が構築した日になっているもの**を消しました。消去したプログラム名は忘れてしまいました。メモしておくべきでした。。)
|
206
|
-
|
207
|
-
|
208
|
-
|
209
|
-
- NVIDIA GPU Computing Toolkitからv10.〇フォルダを消去
|
210
|
-
|
211
|
-
|
212
|
-
|
213
|
-
これらの方法は、[こちら](https://dev.infohub.cc/install-cuda-toolkit-10/#:~:text=%E6%97%A7%20nVIDIA%20CUDA%20Toolkit%20%E3%81%AE%E3%82%A2%E3%83%B3%E3%82%A4%E3%83%B3%E3%82%B9%E3%83%88%E3%83%BC%E3%83%AB,-%E3%81%BE%E3%81%9A%E3%81%AF%E6%97%A7nVIDIA&text=%E3%82%B3%E3%83%B3%E3%83%88%E3%83%AD%E3%83%BC%E3%83%AB%E3%83%91%E3%83%8D%E3%83%AB%E3%81%8B%E3%82%89%E3%80%8C%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%A0%E3%81%AE,%E3%82%92%E8%A6%8B%E3%81%A4%E3%81%91%E3%82%84%E3%81%99%E3%81%8F%E3%81%AA%E3%82%8A%E3%81%BE%E3%81%99%E3%80%82)のサイトを参考にしました。
|
214
|
-
|
215
|
-
|
216
|
-
|
217
|
-
(※4について、正確には10.0をインストールしてからv10.1のフォルダを消去しました。)
|
218
|
-
|
219
|
-
|
220
|
-
|
221
|
-
現在のプログラム構成は次の通りです。並び順はインストール日順です。
|
222
|
-
|
223
|
-
![プログラム構成](f21c978c07a3f884837a33df1a076f21.png)
|
161
|
+
Anacondaプロンプトからバージョン指定でインストールしました。conda listにてバージョンは確認済み。
|
224
162
|
|
225
163
|
|
226
164
|
|
227
165
|
### 試したこと
|
228
166
|
|
229
|
-
これ以上触るのが怖くて、試していません。。
|
230
|
-
|
231
|
-
|
167
|
+
cuDNNのパスについて、**参照サイトだと下1行のみだったのに対し、私の場合だとanaconda3のパスも出ていました。**そのため、anacondaのcudnn64_7.dllにも同様にダウンロードしたファイルを上書きしてみました。しかし、再起動しても結果は変わりませんでした。
|
232
168
|
|
233
169
|
|
234
170
|
|
171
|
+
今回は再構築ということで、少し通常の構築とは状況が異なります。
|
172
|
+
|
235
173
|
どなたか何卒よろしくお願いします。
|