質問するログイン新規登録

質問編集履歴

2

タイトルの修正

2020/12/09 07:34

投稿

Sparrow42
Sparrow42

スコア36

title CHANGED
@@ -1,1 +1,1 @@
1
- Anacondaで構築したtensorflow-gpuが動かない
1
+ Anacondaで構築したtensorflow-gpuが動かない
body CHANGED
File without changes

1

誤って前の保存内容を上げてしまった修正

2020/12/09 07:34

投稿

Sparrow42
Sparrow42

スコア36

title CHANGED
File without changes
body CHANGED
@@ -1,7 +1,7 @@
1
1
  ### 前提・実現したいこと
2
2
 
3
3
  1週間ほど前にAnacondaのGPUが効かなくなったため、環境構築のやり直しを行いました。
4
- GPUに必要なTensorflow, CUDA, cuDNN, MSVC等入れなおしましたが、以前と同じように効きませんでした。
4
+ そして、GPUに必要なTensorflow, CUDA, cuDNN, MSVC等入れなおしましたが効きませんでした。
5
5
  原因にお心当たりのある方にご教授いただければ幸いです。
6
6
 
7
7
  ### 実行環境
@@ -45,14 +45,14 @@
45
45
  それに対して、Tensorflowのバージョン変更などを試しましたが、状況は変わりませんでした。
46
46
 
47
47
  ## google colabで試してみるも、容量やメモリの関係で断念
48
- GPUさえ使えればいいので、以前使用していたgoogle colabでやろうと考えました。しかし、50GB以上学習に必要、メモリも8G程度では足りないことから現実的でないと断念しました。
48
+ GPUさえ使えればいいので、以前使用していたgoogle colabでやろうと考えました。しかし、50GB以上学習に必要な上、メモリも8G程度では足りないことから現実的でないと断念しました。
49
49
 
50
50
  ## バージョンに原因があるかも?と思い、環境再構築へ
51
- GPUが効かなくなってから改めてtensorflowが公表しているGPU環境のバージョン対応を調べたところ、誤って[Linuxのバージョン対応表](https://www.tensorflow.org/install/source?hl=ja)に準拠していたことが判明しました。次の画像の選択部分が**以前構築していたバージョン**です。
51
+ GPUが効かなくなってから改めてTensorflowが公表しているGPU環境のバージョン対応を調べたところ、誤って[Linuxのバージョン対応表](https://www.tensorflow.org/install/source?hl=ja)に準拠していたことが判明しました。次の画像の選択部分が**以前構築していたバージョン**です。
52
52
  ![Linuxのバージョン対応表](ff787c113ef5df5ee1b7e0627bd69a8a.png)
53
53
  [windowsのバージョン対応表](https://www.tensorflow.org/install/source_windows?hl=ja)は次の通りでした。選択部分が**今回構築したバージョン**です。
54
54
  ![windowsのバージョン対応表](53b1177e20441316779f500d793dec36.png)
55
- 元々、1つ上のtensorflow-gpu2.1.0で検討していたのですが、cuDNN7.4にCUDA10.1に対応するバージョンが存在しなかった(※)ため、2.0.0で行いました。
55
+ 元々、1つ上の``tensorflow-gpu2.1.0``で検討していたのですが、``cuDNN7.4````CUDA10.1``に対応するバージョンが存在しなかった(※)ため、2.0.0で行いました。
56
56
 
57
57
  ※追記:[別件の質問](https://teratail.com/questions/308928#reply-432660)にて、[英語ドキュメント](https://www.tensorflow.org/install/source_windows?hl=us#gpu)では以前構築した構成がテスト済みバージョンに入っていることをご教授いただきました。日本語ドキュメントが更新されていないのかもしれないです。
58
58
  ![windowsのバージョン対応表(english)](c1f7ace9776e032945f49bdb8f627298.png)
@@ -72,47 +72,16 @@
72
72
  10.1のアンストと10.0のインストを行いました。詳しくは別件で質問した[CUDAダウングレードの質問](https://teratail.com/questions/308928#reply-432660)をご覧ください。
73
73
 
74
74
  # cuDNN7.6→7.4
75
+ cuDNNをダウンロード・展開し、``C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0``の各ディレクトリの該当ファイルを上書きしました。システム環境変数についても設定済みです。[こちら](https://www.kkaneko.jp/tools/win/cudnn.html)のサイトを参考にしました。
76
+ pathの確認結果は次の画像の通りです。
77
+ ![pathの確認](c4e84c497a855ed63f26fbf72b8afb4d.png)
78
+ (パスが該当サイトと少し違ったので、「試したこと」で検証しました。)
75
79
 
76
80
  # Python3.7→3.6, Tensorflow2.1.0→2.0.0
77
- anacondaプロンプトからバージョン指定でインストールしました。conda listバージョンは確認済み。
81
+ Anacondaプロンプトからバージョン指定でインストールしました。conda listにてバージョンは確認済み。
78
82
 
79
- ### 問題発生までに行ったこと
80
- ##CUDAダウングレードに至った経緯
81
-
82
-
83
- ![Linuxのバージョン対応表](ff787c113ef5df5ee1b7e0627bd69a8a.png)
84
- [windowsのバージョン対応表](https://www.tensorflow.org/install/source_windows?hl=ja)は次の通りでした。選択部分が今回構築しようとしているバージョンです。
85
- ![windowsのバージョン対応表](53b1177e20441316779f500d793dec36.png)
86
- 元々、1つ上のtensorflow-gpu2.1.0で検討していたのですが、cuDNN7.4にCUDA10.1に対応するバージョンが存在しなかったため、2.0.0で行いました。
87
-
88
- ## 環境再構築方法
89
- 変更したのは、MSVC2019→1017、CUDA10.1→10.0です。(CUDAが不具合のため、cuDNN・Python・tensorflowはまだです。)
90
-
91
- # MSVC2019→1017
92
- 2019は消さずに2017を追加する形で変更しました。
93
-
94
- # CUDA10.1→10.0
95
- アンインストールとインストールの作業の流れは以下の通りです。
96
- 1. 10.0をインストール →しかし10.1と共存してしまう。CUDAも動作せず
97
- 2. 10.1をアンインストール(方法は後に説明)→CUDA動作せず
98
- 3. 10.0もアンインストール
99
- 4. 10.0をインストール →CUDA動作せず
100
-
101
- アンインストールは2つの方法で行いました。
102
- - コントロールパネルからNVIDIA関連のプログラムを消去
103
- (具体的には、NVIDIA関連の中でも**インストール日が構築した日になっているもの**を消しました。消去したプログラム名は忘れてしまいました。メモしておくべきでした。。)
104
-
105
- - NVIDIA GPU Computing Toolkitからv10.〇フォルダを消去
106
-
107
- これらの方法は、[こちら](https://dev.infohub.cc/install-cuda-toolkit-10/#:~:text=%E6%97%A7%20nVIDIA%20CUDA%20Toolkit%20%E3%81%AE%E3%82%A2%E3%83%B3%E3%82%A4%E3%83%B3%E3%82%B9%E3%83%88%E3%83%BC%E3%83%AB,-%E3%81%BE%E3%81%9A%E3%81%AF%E6%97%A7nVIDIA&text=%E3%82%B3%E3%83%B3%E3%83%88%E3%83%AD%E3%83%BC%E3%83%AB%E3%83%91%E3%83%8D%E3%83%AB%E3%81%8B%E3%82%89%E3%80%8C%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%A0%E3%81%AE,%E3%82%92%E8%A6%8B%E3%81%A4%E3%81%91%E3%82%84%E3%81%99%E3%81%8F%E3%81%AA%E3%82%8A%E3%81%BE%E3%81%99%E3%80%82)のサイトを参考にしました。
108
-
109
- (※4について、正確には10.0をインストールしてからv10.1のフォルダを消去しました。)
110
-
111
- 現在のプログラム構成は次の通りです。並び順はインストール日順です。
112
- ![プログラム構成](f21c978c07a3f884837a33df1a076f21.png)
113
-
114
83
  ### 試したこと
115
- これ以上触るのが怖くて、試していません。。
116
- バージョン対応問題が解決できるならCUDA10.1戻すいう選択肢ありかと考えていま現状、その選択肢は思いついいない
84
+ cuDNNパスについて**参照サイトだと下1行のみだったの対し、私の場合だanaconda3のパスていました**そのため、anacondacudnn64_7.dllにも同様にダウンロードしたファイルを上書きしみました。しかし、再起動しても結果は変わりませんした
117
85
 
86
+ 今回は再構築ということで、少し通常の構築とは状況が異なります。
118
87
  どなたか何卒よろしくお願いします。