やりたい事の概要を以下に書きます。
44で要素が0~3のtensor_1から、44*4のtensor_2を作りたい。
tensor_2の3軸目は、インデックスに対応したtensor_1の要素と一致している場合に1となります。
tensor_1
[[0, 2, 1, 3],
[1, 3, 0, 0],
[2, 1, 3, 2],
[0, 2, 3, 1]]
↓
tensor_2[:, :, 0]
[[1, 0, 0, 0],
[0, 0, 1, 1],
[0, 0, 0, 0],
[1, 0, 0, 0]]
tensor_2[:, :, 1]
[[0, 0, 1, 0],
[1, 0, 0, 0],
[0, 1, 0, 0],
[0, 0, 0, 1]]
tensor_2[:, :, 2]
[[0, 1, 0, 0],
[0, 0, 0, 0],
[1, 0, 0, 1],
[0, 1, 0, 0]]
tensor_2[:, :, 3]
[[0, 0, 0, 1],
[0, 1, 0, 0],
[0, 0, 1, 0],
[0, 0, 1, 0]]
上のは例であり、実際想定しているtenosr_1のシェイプは[1000, 1200]で、取りうる要素は0~65の整数です。
このtensor_2を作るのに、私は以下のコードを書きました。
whereでそれぞれの数字に対してのテンソルを作り、それらを3軸目でconcatして[1000, 1200, 66]のtenosr_2を作っています。
python
1# shapeを取得 2h = tf.shape(tensor_1)[0] 3w = tf.shape(tensor_1)[1] 4c = 66 # チャンネル数 5 6# 0番目の要素を取得 7tensor_2 = tf.where(tensor_1 == 0, 1, 0) 8tensor_2 = tensor_2.reshape((h, w, 1)) # 軸を増やす 9 10# ループで1~65の要素を加える 11for i in range(1, c): 12 x = tf.where(tensor_1 == i, 1, 0) 13 x = tensor_2.reshape((h, w, 1)) 14 15 # 結合する 16 tensor_2 = tf.concat([tensor_2 , x], axis=2) # 3軸目で結合
これにより、望みのtensor_2を作ることができたのですが、予想以上に処理に時間がかかってしました。
処理に時間がかかる場所を調べた結果、それはconcatでした。
配列の末尾を追加するのは時間がかかると聞いたことがあるので、それが原因なのかなと。。。
上記のtensor_2を素早く作る方法をご存じの方がおられましたらご教示お願いします。
〇なぜこの変換が必要か
セグメンテーションの深層学習をする際に、アノテーションデータの容量を節約するためtensor_1の形式で保存しました。
tf.datasetの前処理で、アノテーション毎にチャンネルを作る必要があり、この変換が必要になりました。
〇試したこと
先にtensor_2をtf.zeros((h, w, c), dtype(tf.int32))として作っておき、そこに代入すれば早いのではないかと考えたのですが、テンソルはスライスに代入することができないので失敗しました。
(前処理なので、Variable変数にしてassignすることは出来ないとの理解です)
python
1tensor_2 = tf.zeros((h, w, c), dtype(tf.int32)) 2for i in range(c): 3 tensor_2[: ,:, i] = tf.where(tensor_1 == i, 1, 0) 4 5TypeError: 'tensorflow.python.framework.ops.EagerTensor' object does not support item assignment
〇環境
python3.8
tensorflow2.4
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/08/02 12:03