teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

1

質問部の追加

2021/12/01 13:26

投稿

koroyama56
koroyama56

スコア0

title CHANGED
File without changes
body CHANGED
@@ -1,3 +1,12 @@
1
+ ### 前提・実現したいこと
2
+ WSL2でGPUを用いた機械学習を行おうとしています。
3
+ dockerは使用せず、anacondaで環境構築しています。
4
+ 以下のようなサンプルコードを走らせると、1epochごとの計算は早いのですが、計算が始まるまでにかなり時間がかかります(4分くらい)。
5
+ 学習開始までの時間を短くしたいです。
6
+
7
+ ### 発生している問題・エラーメッセージ
8
+ 最初のEpochが開始されるまでに4分くらいかかります。
9
+ 出力ログ:
1
10
  ```
2
11
  2021-12-01 20:27:10.719869: I tensorflow/stream_executor/platform/default/dso_loader.cc:49] Successfully opened dynamic library libcudart.so.10.1
3
12
  2.4.1
@@ -73,9 +82,7 @@
73
82
  Test accuracy: 0.1006999984383583
74
83
  time: 284.1962425708771
75
84
  ```
76
-
77
85
  ### 該当のソースコード
78
-
79
86
  ```python
80
87
  import time
81
88
  import tensorflow as tf
@@ -85,8 +92,6 @@
85
92
  time0 = time.time()
86
93
  print(tf.__version__)
87
94
 
88
- #fashion_mnist = keras.datasets.fashion_mnist
89
- #(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
90
95
  #dummy data
91
96
  train_images = np.random.rand(60000, 28, 28)
92
97
  train_labels = np.random.rand(0,10,60000)
@@ -108,27 +113,22 @@
108
113
  print('\nTest accuracy:', test_acc)
109
114
  print("time: ", time.time() - time0)
110
115
  ```
111
-
112
116
  ### 試したこと
113
117
  nvidia-smi等でGPUにメモリが割り当てられている様子は確認しています。
114
118
 
115
119
  また、環境を変えたときの挙動を調べました。
116
- ・GPUを使用しないでプログラムを走らせると、学習はすぐに開始しました。
120
+ ・GPUを使用しない場合
117
- ・nvidaの提供しているdockerイメージ環境においてプログラムを走らせると、学習はすぐに開始しました。
121
+ ・nvidaの提供しているdockerイメージ環境
118
- ・別の純粋なLinuxのPCでプログラムを走らせると、学習はすぐに開始しました。
122
+ ・別の純粋なLinuxのPCでの環境
123
+ いずれも学習はすぐに開始されました。
119
124
 
120
125
  純粋なLinux環境と比べ、WSL2環境ではNUMAサポートがないというエラーメッセージが出力ログに追加されているという違いがありました。一方、WSL2+docker環境でもこのメッセージは出力されていました(EではなくIにタグは変わっていました)ので、NUMAサポートがないことが時間がかかる直接的な原因ではないのではないかと思っています。
121
-
122
-
123
-
124
- ### 補足情報(FW/ツールのバージョンなど)
126
+ ### 補足情報
125
- OS:Windows11 Pro
127
+ OS:Windows11 Pro, バージョン:21H2
126
- バージョン:21H2
127
128
  CPU:Intel Core i9-9900K @ 3.60GHz
128
129
  GPU:NVIDIA GeForce RTX 3090
129
130
  GPUドライバ:nvidia geforce GameReady 510.06
130
- CUDA Version: 11.6
131
+ CUDA: 11.6
131
-
132
132
  Ubuntu 20.04.3 LTS
133
133
  anaconda 3.5.1
134
134
  python 3.7.11