環境
- Ubuntu 18.04
- Python 3.6.8
- tensorflow 1.12.0
実現したいこと
テンソル(None, 7, 7, 10)があるような状況です。このテンソルに対して
- 最初のバッチのデータの10枚の特徴マップから、特徴マップ(7 x 7)の平均値が最も大きいものを取り出す
- 2枚目以降のバッチでも同じことをする
- それらをstackして(None, 7, 7)のテンソルを作る
ということを実現したいです。
これまでやったこと
以下が該当部分のレイヤーを定義している部分です。
python
1class Adversarial(tf.keras.layers.Layer): 2 def __init__(self, batch_size, threshold): 3 super(Adversarial, self).__init__(self) 4 self.batch_size = batch_size 5 self.threshold = threshold # この変数は質問とは関係ないので無視してください 6 7 def call(self, inputs, **kwargs): 8 vgg_end, interm, branchA_end = inputs # (?, 7, 7, 512), (?, 7, 7, 10), (?, 10) 9 max_idx = tf.argmax(branchA_end, axis=1) 10 11 tmp = [] 12 13 for bt in range(self.batch_size): 14 try: 15 a = tf.reshape(interm[bt, :, :, max_idx[bt]], [7, 7, 1]) 16 each = tf.tile(a, [1, 1, 512]) 17 18 tmp.append(each) 19 except: 20 break 21 22 # ここから下は質問とは直接関係ない 23 tmp = tf.stack(tmp) 24 tmp = tf.where(tmp > self.threshold, tmp, tmp * 0) 25 26 adv = tf.subtract(vgg_end, tmp) 27 28 return adv
この質問では、vgg_end
は関係ないので無視してください。特徴マップを取り出したいテンソルがinterm
で、branchA_end
はinterm
でグローバルアベレージプーリングを取って(None, 10)の大きさにしたものです。
max_idx
で、各バッチで何番目の特徴量マップの平均値が一番大きいかのテンソルを計算しています。
今詰まっているのはfor bt in range(self.batch_size):
の部分で、バッチサイズをハードコードしてしまっているために、実際の訓練のときに、各エポックの最後で、バッチサイズが指定したものとずれてしまう場合にエラーが出てしまいます(例えばデータ数が350でバッチサイズを20にすると、最後のバッチだけデータの個数の都合上10になってしまう)。
bash
12019-07-27 15:50:43.277805: W tensorflow/core/framework/op_kernel.cc:1273] OP_REQUIRES failed at strided_slice_op.cc:106 : Invalid argument: slice index 4 of dimension 0 out of bounds. 2Traceback (most recent call last): 3 File "train.py", line 67, in <module> 4 train(parser) 5 File "train.py", line 60, in train 6 use_multiprocessing=True, 7 File "/home/yudai/.conda/envs/tf-gpu/lib/python3.6/site-packages/tensorflow/python/keras/engine/training.py", line 2177, in fit_generator 8 initial_epoch=initial_epoch) 9 File "/home/yudai/.conda/envs/tf-gpu/lib/python3.6/site-packages/tensorflow/python/keras/engine/training_generator.py", line 176, in fit_generator 10 x, y, sample_weight=sample_weight, class_weight=class_weight) 11 File "/home/yudai/.conda/envs/tf-gpu/lib/python3.6/site-packages/tensorflow/python/keras/engine/training.py", line 1932, in train_on_batch 12 self, x, y, sample_weights=sample_weights) 13 File "/home/yudai/.conda/envs/tf-gpu/lib/python3.6/site-packages/tensorflow/python/keras/engine/training_eager.py", line 556, in train_on_batch 14 model, inputs, targets, sample_weights=sample_weights, training=True) 15 File "/home/yudai/.conda/envs/tf-gpu/lib/python3.6/site-packages/tensorflow/python/keras/engine/training_eager.py", line 511, in _process_single_batch 16 training=training) 17 File "/home/yudai/.conda/envs/tf-gpu/lib/python3.6/site-packages/tensorflow/python/keras/engine/training_eager.py", line 90, in _model_loss 18 outs, masks = model._call_and_compute_mask(inputs, **kwargs) 19 File "/home/yudai/.conda/envs/tf-gpu/lib/python3.6/site-packages/tensorflow/python/keras/engine/network.py", line 856, in _call_and_compute_mask 20 mask=masks) 21 File "/home/yudai/.conda/envs/tf-gpu/lib/python3.6/site-packages/tensorflow/python/keras/engine/network.py", line 1052, in _run_internal_graph 22 output_tensors = layer.call(computed_tensors, **kwargs) 23 File "/home/yudai/Documents/Python/MachineLearning/ML_models/ACoL/model.py", line 49, in call 24 a = tf.reshape(interm[bt, :, :, max_idx[bt]], [7, 7, 1]) 25 File "/home/yudai/.conda/envs/tf-gpu/lib/python3.6/site-packages/tensorflow/python/ops/array_ops.py", line 525, in _slice_helper 26 name=name) 27 File "/home/yudai/.conda/envs/tf-gpu/lib/python3.6/site-packages/tensorflow/python/ops/array_ops.py", line 691, in strided_slice 28 shrink_axis_mask=shrink_axis_mask) 29 File "/home/yudai/.conda/envs/tf-gpu/lib/python3.6/site-packages/tensorflow/python/ops/gen_array_ops.py", line 8556, in strided_slice 30 _six.raise_from(_core._status_to_exception(e.code, message), None) 31 File "<string>", line 3, in raise_from 32tensorflow.python.framework.errors_impl.InvalidArgumentError: slice index 4 of dimension 0 out of bounds. [Op:StridedSlice] name: adversarial/strided_slice/
これを解消するにはどのように書き換えればよいでしょうか?
よろしくお願いします。
あなたの回答
tips
プレビュー