質問編集履歴

3

追記

2019/10/04 05:09

投稿

Mustard
Mustard

スコア11

test CHANGED
File without changes
test CHANGED
@@ -125,3 +125,65 @@
125
125
  WARNING:tensorflow:Entity <bound method Conv.call of <tensorflow.python.layers.convolutional.Conv2D object at 0x000001C557142828>> could not be transformed and will be executed as-is. Please report this to the AutgoGraph team. When filing the bug, set the verbosity to 10 (on Linux, `export AUTOGRAPH_VERBOSITY=10`) and attach the full output. Cause: converting <bound method Conv.call of <tensorflow.python.layers.convolutional.Conv2D object at 0x000001C557142828>>: AssertionError: Bad argument number for Name: 3, expecting 4
126
126
 
127
127
  ```
128
+
129
+
130
+
131
+ (追記2)
132
+
133
+ gastのバージョンを0.3.2から0.2.2にすることで追記に示したエラーが消えました。
134
+
135
+ 出てくる警告はtf.xxx系の関数が非推奨なのでtf.compat.v1.xxxを代わりに使えというものですがこれは無視してよいのでしょうか。
136
+
137
+ また、以下のエラーが発生し、結局local_test.shは正常終了しません。
138
+
139
+ ResourceExhaustedErrorなのでtrain.py内のバッチサイズやクロップサイズなどを弄ってみているのですが、解決いたしません...
140
+
141
+ 何か方法をご存知でしょうか。
142
+
143
+ ```error
144
+
145
+ 2019-10-04 13:58:24.570618: W tensorflow/core/framework/op_kernel.cc:1502] OP_REQUIRES failed at conv_ops.cc:486 : Resource exhausted: OOM when allocating tensor with shape[4,128,257,257] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc
146
+
147
+ Traceback (most recent call last):
148
+
149
+ File "C:\Users\XXX\Anaconda3\envs\TensorFlow\lib\site-packages\tensorflow\python\client\session.py", line 1356, in _do_call
150
+
151
+ return fn(*args)
152
+
153
+ File "C:\Users\XXX\Anaconda3\envs\TensorFlow\lib\site-packages\tensorflow\python\client\session.py", line 1341, in _run_fn
154
+
155
+ options, feed_dict, fetch_list, target_list, run_metadata)
156
+
157
+ File "C:\Users\XXX\Anaconda3\envs\TensorFlow\lib\site-packages\tensorflow\python\client\session.py", line 1429, in _call_tf_sessionrun
158
+
159
+ run_metadata)
160
+
161
+ tensorflow.python.framework.errors_impl.ResourceExhaustedError: 2 root error(s) found.
162
+
163
+ (0) Resource exhausted: OOM when allocating tensor with shape[4,128,257,257] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc
164
+
165
+ [[{{node xception_65/entry_flow/block1/unit_1/xception_module/separable_conv2_pointwise/Conv2D}}]]
166
+
167
+ Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info.
168
+
169
+
170
+
171
+ [[gradients/xception_65/middle_flow/block1/unit_5/xception_module/separable_conv3_depthwise/BatchNorm/FusedBatchNorm_grad/FusedBatchNormGrad/_12968]]
172
+
173
+ Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info.
174
+
175
+
176
+
177
+ (1) Resource exhausted: OOM when allocating tensor with shape[4,128,257,257] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc
178
+
179
+ [[{{node xception_65/entry_flow/block1/unit_1/xception_module/separable_conv2_pointwise/Conv2D}}]]
180
+
181
+ Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info.
182
+
183
+
184
+
185
+ 0 successful operations.
186
+
187
+ 0 derived errors ignored.
188
+
189
+ ```

2

追記

2019/10/04 05:09

投稿

Mustard
Mustard

スコア11

test CHANGED
File without changes
test CHANGED
@@ -113,3 +113,15 @@
113
113
  absl.flags._exceptions.Error: Missing value for flag -v
114
114
 
115
115
  ```
116
+
117
+
118
+
119
+ (追記)
120
+
121
+ local_test.sh内40行目のpython "${WORK_DIR}"/model_test.py -vをpython "${WORK_DIR}"/model_test.py -v -1にしたところ実行が通りました。ただ以下の警告が多少の形を変えて数百行繰り返し発生してしまうのですが、これは何が問題なのでしょうか。
122
+
123
+ ```
124
+
125
+ WARNING:tensorflow:Entity <bound method Conv.call of <tensorflow.python.layers.convolutional.Conv2D object at 0x000001C557142828>> could not be transformed and will be executed as-is. Please report this to the AutgoGraph team. When filing the bug, set the verbosity to 10 (on Linux, `export AUTOGRAPH_VERBOSITY=10`) and attach the full output. Cause: converting <bound method Conv.call of <tensorflow.python.layers.convolutional.Conv2D object at 0x000001C557142828>>: AssertionError: Bad argument number for Name: 3, expecting 4
126
+
127
+ ```

1

追記

2019/10/02 09:38

投稿

Mustard
Mustard

スコア11

test CHANGED
File without changes
test CHANGED
@@ -9,6 +9,8 @@
9
9
  一方でlocal_test.shは以下のエラーが発生し、実行が正常に終了しません。
10
10
 
11
11
  どうすれば実行できるのでしょうか。
12
+
13
+ vの値がないと言われているので-vオプションで値を指定してあげればいいのかと考えていますがsh local_test.sh -v -1を実行しても同じエラーメッセージが出てくるだけでした。
12
14
 
13
15
  当方機械学習はおろか、python自体に触れるのが今回が初のため、どのような対処が必要なのか皆目見当がつきません。
14
16