質問編集履歴

2

タイトルの修正

2020/12/09 07:34

投稿

Sparrow42
Sparrow42

スコア36

test CHANGED
@@ -1 +1 @@
1
- Anacondaで構築したtensorflow-gpuが動かない
1
+ Anacondaで構築したtensorflow-gpuが動かない
test CHANGED
File without changes

1

誤って前の保存内容を上げてしまった修正

2020/12/09 07:34

投稿

Sparrow42
Sparrow42

スコア36

test CHANGED
File without changes
test CHANGED
@@ -4,7 +4,7 @@
4
4
 
5
5
  1週間ほど前にAnacondaのGPUが効かなくなったため、環境構築のやり直しを行いました。
6
6
 
7
- GPUに必要なTensorflow, CUDA, cuDNN, MSVC等入れなおしましたが、以前と同じように効きませんでした。
7
+ そして、GPUに必要なTensorflow, CUDA, cuDNN, MSVC等入れなおしましたが効きませんでした。
8
8
 
9
9
  原因にお心当たりのある方にご教授いただければ幸いです。
10
10
 
@@ -92,13 +92,13 @@
92
92
 
93
93
  ## google colabで試してみるも、容量やメモリの関係で断念
94
94
 
95
- GPUさえ使えればいいので、以前使用していたgoogle colabでやろうと考えました。しかし、50GB以上学習に必要、メモリも8G程度では足りないことから現実的でないと断念しました。
95
+ GPUさえ使えればいいので、以前使用していたgoogle colabでやろうと考えました。しかし、50GB以上学習に必要な上、メモリも8G程度では足りないことから現実的でないと断念しました。
96
96
 
97
97
 
98
98
 
99
99
  ## バージョンに原因があるかも?と思い、環境再構築へ
100
100
 
101
- GPUが効かなくなってから改めてtensorflowが公表しているGPU環境のバージョン対応を調べたところ、誤って[Linuxのバージョン対応表](https://www.tensorflow.org/install/source?hl=ja)に準拠していたことが判明しました。次の画像の選択部分が**以前構築していたバージョン**です。
101
+ GPUが効かなくなってから改めてTensorflowが公表しているGPU環境のバージョン対応を調べたところ、誤って[Linuxのバージョン対応表](https://www.tensorflow.org/install/source?hl=ja)に準拠していたことが判明しました。次の画像の選択部分が**以前構築していたバージョン**です。
102
102
 
103
103
  ![Linuxのバージョン対応表](ff787c113ef5df5ee1b7e0627bd69a8a.png)
104
104
 
@@ -106,7 +106,7 @@
106
106
 
107
107
  ![windowsのバージョン対応表](53b1177e20441316779f500d793dec36.png)
108
108
 
109
- 元々、1つ上のtensorflow-gpu2.1.0で検討していたのですが、cuDNN7.4にCUDA10.1に対応するバージョンが存在しなかった(※)ため、2.0.0で行いました。
109
+ 元々、1つ上の``tensorflow-gpu2.1.0``で検討していたのですが、``cuDNN7.4````CUDA10.1``に対応するバージョンが存在しなかった(※)ため、2.0.0で行いました。
110
110
 
111
111
 
112
112
 
@@ -146,90 +146,28 @@
146
146
 
147
147
  # cuDNN7.6→7.4
148
148
 
149
+ cuDNNをダウンロード・展開し、``C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0``の各ディレクトリの該当ファイルを上書きしました。システム環境変数についても設定済みです。[こちら](https://www.kkaneko.jp/tools/win/cudnn.html)のサイトを参考にしました。
150
+
151
+ pathの確認結果は次の画像の通りです。
152
+
153
+ ![pathの確認](c4e84c497a855ed63f26fbf72b8afb4d.png)
154
+
155
+ (パスが該当サイトと少し違ったので、「試したこと」で検証しました。)
156
+
149
157
 
150
158
 
151
159
  # Python3.7→3.6, Tensorflow2.1.0→2.0.0
152
160
 
153
- anacondaプロンプトからバージョン指定でインストールしました。conda listバージョンは確認済み。
154
-
155
-
156
-
157
- ### 問題発生までに行ったこと
158
-
159
- ##CUDAダウングレードに至った経緯
160
-
161
-
162
-
163
-
164
-
165
- ![Linuxのバージョン対応表](ff787c113ef5df5ee1b7e0627bd69a8a.png)
166
-
167
- [windowsのバージョン対応表](https://www.tensorflow.org/install/source_windows?hl=ja)は次の通りでした。選択部分が今回構築しようとしているバージョンです。
168
-
169
- ![windowsのバージョン対応表](53b1177e20441316779f500d793dec36.png)
170
-
171
- 元々、1つ上のtensorflow-gpu2.1.0で検討していたのですが、cuDNN7.4にCUDA10.1に対応するバージョンが存在しなかったため、2.0.0で行いました。
172
-
173
-
174
-
175
- ## 環境再構築方法
176
-
177
- 変更したのは、MSVC2019→1017、CUDA10.1→10.0です。(CUDAが不具合のため、cuDNN・Python・tensorflowはまだです。)
178
-
179
-
180
-
181
- # MSVC2019→1017
182
-
183
- 2019は消さずに2017を追加する形で変更しました。
184
-
185
-
186
-
187
- # CUDA10.1→10.0
188
-
189
- アンインストールとインストールの作業の流れは以下の通りです。
190
-
191
- 1. 10.0をインストール →しかし10.1と共存してしまう。CUDAも動作せず
192
-
193
- 2. 10.1をアンインストール(方法は後に説明)→CUDA動作せず
194
-
195
- 3. 10.0もアンインストール
196
-
197
- 4. 10.0をインストール →CUDA動作せず
198
-
199
-
200
-
201
- アンインストールは2つの方法で行いました。
202
-
203
- - コントロールパネルからNVIDIA関連のプログラムを消去
204
-
205
- (具体的には、NVIDIA関連の中でも**インストール日が構築した日になっているもの**を消しました。消去したプログラム名は忘れてしまいました。メモしておくべきでした。。)
206
-
207
-
208
-
209
- - NVIDIA GPU Computing Toolkitからv10.〇フォルダを消去
210
-
211
-
212
-
213
- これらの方法は、[こちら](https://dev.infohub.cc/install-cuda-toolkit-10/#:~:text=%E6%97%A7%20nVIDIA%20CUDA%20Toolkit%20%E3%81%AE%E3%82%A2%E3%83%B3%E3%82%A4%E3%83%B3%E3%82%B9%E3%83%88%E3%83%BC%E3%83%AB,-%E3%81%BE%E3%81%9A%E3%81%AF%E6%97%A7nVIDIA&text=%E3%82%B3%E3%83%B3%E3%83%88%E3%83%AD%E3%83%BC%E3%83%AB%E3%83%91%E3%83%8D%E3%83%AB%E3%81%8B%E3%82%89%E3%80%8C%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%A0%E3%81%AE,%E3%82%92%E8%A6%8B%E3%81%A4%E3%81%91%E3%82%84%E3%81%99%E3%81%8F%E3%81%AA%E3%82%8A%E3%81%BE%E3%81%99%E3%80%82)のサイトを参考にしました。
214
-
215
-
216
-
217
- (※4について、正確には10.0をインストールしてからv10.1のフォルダを消去しました。)
218
-
219
-
220
-
221
- 現在のプログラム構成は次の通りです。並び順はインストール日順です。
222
-
223
- ![プログラム構成](f21c978c07a3f884837a33df1a076f21.png)
161
+ Anacondaプロンプトからバージョン指定でインストールしました。conda listにてバージョンは確認済み。
224
162
 
225
163
 
226
164
 
227
165
  ### 試したこと
228
166
 
229
- これ以上触るのが怖くて、試していません。。
230
-
231
- バージョン対応問題が解決できるならCUDA10.1戻すいう選択肢ありかと考えていま現状、その選択肢思いついていない
167
+ cuDNNパスについて**参照サイトだと下1行のみだったの対し、私の場合だanaconda3のパスていました**そのため、anacondacudnn64_7.dllにも同様にダウンロードしたファイルを上書きしてみました。しかし、再起動しても結果変わりませんした
232
168
 
233
169
 
234
170
 
171
+ 今回は再構築ということで、少し通常の構築とは状況が異なります。
172
+
235
173
  どなたか何卒よろしくお願いします。