質問編集履歴

修正

2023/01/30 11:47

投稿

harug

スコア28

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -13,6 +13,6 @@
 ### 試したこと
-調べたところ，最後の畳み込み層(conv層)を指定するとよいとのことでしたので，最後から11層目の"conv5_block3_3_conv"をしていたのですが，その一つ手前のconv5_block3_outなどでもGradCAMは生成されるので，どの層を指定するべきなのかが分からなくなってしまいました.
+調べたところ，最後の畳み込み層(conv層)を指定するとよいとのことでしたので，最後から9層目の"conv5_block3_3_conv"を指定していたのですが，その一つ手前のconv5_block3_outなどでもGradCAMは生成されるので，どの層を指定するべきなのかが分からなくなってしまいました.
 ResNet50v2の場合はこのままconv5_block3_3_convを設定すればよいのでしょうか.

Keras 深層学習 CNN (Convolutional Neural Network)機械学習 Python

文の追加

2023/01/30 11:32

投稿

harug

スコア28

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -7,6 +7,7 @@
 とても長いですが，注目すべきは最後の方の層だと思います.(文字数の関係で最初の方は省略しています)
 ### modalのsummary
+実際にはResNet50v2 + ArcFaceのモデルを構築し，写真はその最後の方を載せています.
 ※ArcfaceLayerは自作レイヤーになります.
 ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-01-30/18347a19-4d8d-4201-ab77-8b30c6cfc661.png)

Keras 深層学習 CNN (Convolutional Neural Network)機械学習 Python

画像の挿入

2023/01/30 11:28

投稿

harug

スコア28

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- Grad-CAM生成時，~~ResNet50v2~~のどの層を指定するべきか
1	+ Grad-CAM生成時，モデルのどの層を指定するべきか

body CHANGED Viewed

@@ -1,97 +1,15 @@
 ### 実現したいこと
 GradCAMの実装についてです.
-ResNet50v2のどの層から特徴量の抽出を行えばよいのかが分かりません.
+モデルのどの層から特徴量の抽出を行えばよいのかが分かりません.
-以下に，現在使用しているmodelのアーキテクチャをお見せします.
+以下に，現在使用しているモデルのアーキテクチャをお見せします.
-とても長いですが，注目すべきは最後の方の層だと思います.(文字数の関係で途中省略しています)
+とても長いですが，注目すべきは最後の方の層だと思います.(文字数の関係で最初の方は省略しています)
-### ResNet50v2のsummary
+### modalのsummary
+※ArcfaceLayerは自作レイヤーになります.
+![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-01-30/18347a19-4d8d-4201-ab77-8b30c6cfc661.png)
-```
-Model: "model_12"
-__________________________________________________________________________________________________
- Layer (type)                   Output Shape         Param #     Connected to
-==================================================================================================
- input_25 (InputLayer)          [(None, 110, 110, 1  0           []
-                                )]
- conv2d_12 (Conv2D)             (None, 110, 110, 3)  150         ['input_25[0][0]']
- batch_normalization_24 (BatchN  (None, 110, 110, 3)  12         ['conv2d_12[0][0]']
- ormalization)
- activation_12 (Activation)     (None, 110, 110, 3)  0           ['batch_normalization_24[0][0]']
- conv1_pad (ZeroPadding2D)      (None, 116, 116, 3)  0           ['activation_12[0][0]']
- conv1_conv (Conv2D)            (None, 55, 55, 64)   9472        ['conv1_pad[0][0]']
- pool1_pad (ZeroPadding2D)      (None, 57, 57, 64)   0           ['conv1_conv[0][0]']
- pool1_pool (MaxPooling2D)      (None, 28, 28, 64)   0           ['pool1_pad[0][0]']
-                                              ・
-　　　　                                       ・　(文字数の関係で省略)
-　　　　　　　　　　                            ・
- conv5_block3_preact_bn (BatchN  (None, 4, 4, 2048)  8192        ['conv5_block2_out[0][0]']
- ormalization)
- conv5_block3_preact_relu (Acti  (None, 4, 4, 2048)  0           ['conv5_block3_preact_bn[0][0]']
- vation)
- conv5_block3_1_conv (Conv2D)   (None, 4, 4, 512)    1048576     ['conv5_block3_preact_relu[0][0]'
-                                                                 ]
- conv5_block3_1_bn (BatchNormal  (None, 4, 4, 512)   2048        ['conv5_block3_1_conv[0][0]']
- ization)
- conv5_block3_1_relu (Activatio  (None, 4, 4, 512)   0           ['conv5_block3_1_bn[0][0]']
- n)
- conv5_block3_2_pad (ZeroPaddin  (None, 6, 6, 512)   0           ['conv5_block3_1_relu[0][0]']
- g2D)
- conv5_block3_2_conv (Conv2D)   (None, 4, 4, 512)    2359296     ['conv5_block3_2_pad[0][0]']
- conv5_block3_2_bn (BatchNormal  (None, 4, 4, 512)   2048        ['conv5_block3_2_conv[0][0]']
- ization)
- conv5_block3_2_relu (Activatio  (None, 4, 4, 512)   0           ['conv5_block3_2_bn[0][0]']
- n)
- conv5_block3_3_conv (Conv2D)   (None, 4, 4, 2048)   1050624     ['conv5_block3_2_relu[0][0]']
- conv5_block3_out (Add)         (None, 4, 4, 2048)   0           ['conv5_block2_out[0][0]',
-                                                                  'conv5_block3_3_conv[0][0]']
- post_bn (BatchNormalization)   (None, 4, 4, 2048)   8192        ['conv5_block3_out[0][0]']
- post_relu (Activation)         (None, 4, 4, 2048)   0           ['post_bn[0][0]']
- flatten_12 (Flatten)           (None, 32768)        0           ['post_relu[0][0]']
- hidden (Dense)                 (None, 512)          16777728    ['flatten_12[0][0]']
- batch_normalization_25 (BatchN  (None, 512)         2048        ['hidden[0][0]']
- ormalization)
- input_26 (InputLayer)          [(None, 29)]         0           []
- arcfacelayer_12 (Arcfacelayer)  (None, 29)          14848       ['batch_normalization_25[0][0]',
-                                                                  'input_26[0][0]']
- dense_12 (Dense)               (None, 29)           870         ['arcfacelayer_12[0][0]']
-==================================================================================================
-Total params: 40,360,456
-Trainable params: 40,313,986
-Non-trainable params: 46,470
-__________________________________________________________________________________________________
-```
 ### 試したこと
 調べたところ，最後の畳み込み層(conv層)を指定するとよいとのことでしたので，最後から11層目の"conv5_block3_3_conv"をしていたのですが，その一つ手前のconv5_block3_outなどでもGradCAMは生成されるので，どの層を指定するべきなのかが分からなくなってしまいました.

Keras 深層学習 CNN (Convolutional Neural Network)機械学習 Python

summaryの追加

2023/01/28 18:53

投稿

harug

スコア28

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -4,11 +4,94 @@
 ResNet50v2のどの層から特徴量の抽出を行えばよいのかが分かりません.
 以下に，現在使用しているmodelのアーキテクチャをお見せします.
-とても長いですが，注目すべきは最後の方の層だと思います.(念のため全て載せます)
+とても長いですが，注目すべきは最後の方の層だと思います.(文字数の関係で途中省略しています)
 ### ResNet50v2のsummary
+```
+Model: "model_12"
+__________________________________________________________________________________________________
+ Layer (type)                   Output Shape         Param #     Connected to
+==================================================================================================
+ input_25 (InputLayer)          [(None, 110, 110, 1  0           []
+                                )]
+ conv2d_12 (Conv2D)             (None, 110, 110, 3)  150         ['input_25[0][0]']
+ batch_normalization_24 (BatchN  (None, 110, 110, 3)  12         ['conv2d_12[0][0]']
+ ormalization)
+ activation_12 (Activation)     (None, 110, 110, 3)  0           ['batch_normalization_24[0][0]']
+ conv1_pad (ZeroPadding2D)      (None, 116, 116, 3)  0           ['activation_12[0][0]']
+ conv1_conv (Conv2D)            (None, 55, 55, 64)   9472        ['conv1_pad[0][0]']
+ pool1_pad (ZeroPadding2D)      (None, 57, 57, 64)   0           ['conv1_conv[0][0]']
+ pool1_pool (MaxPooling2D)      (None, 28, 28, 64)   0           ['pool1_pad[0][0]']
+                                              ・
+　　　　                                       ・　(文字数の関係で省略)
+　　　　　　　　　　                            ・
+ conv5_block3_preact_bn (BatchN  (None, 4, 4, 2048)  8192        ['conv5_block2_out[0][0]']
+ ormalization)
+ conv5_block3_preact_relu (Acti  (None, 4, 4, 2048)  0           ['conv5_block3_preact_bn[0][0]']
+ vation)
+ conv5_block3_1_conv (Conv2D)   (None, 4, 4, 512)    1048576     ['conv5_block3_preact_relu[0][0]'
+                                                                 ]
+ conv5_block3_1_bn (BatchNormal  (None, 4, 4, 512)   2048        ['conv5_block3_1_conv[0][0]']
+ ization)
+ conv5_block3_1_relu (Activatio  (None, 4, 4, 512)   0           ['conv5_block3_1_bn[0][0]']
+ n)
+ conv5_block3_2_pad (ZeroPaddin  (None, 6, 6, 512)   0           ['conv5_block3_1_relu[0][0]']
+ g2D)
+ conv5_block3_2_conv (Conv2D)   (None, 4, 4, 512)    2359296     ['conv5_block3_2_pad[0][0]']
+ conv5_block3_2_bn (BatchNormal  (None, 4, 4, 512)   2048        ['conv5_block3_2_conv[0][0]']
+ ization)
+ conv5_block3_2_relu (Activatio  (None, 4, 4, 512)   0           ['conv5_block3_2_bn[0][0]']
+ n)
+ conv5_block3_3_conv (Conv2D)   (None, 4, 4, 2048)   1050624     ['conv5_block3_2_relu[0][0]']
+ conv5_block3_out (Add)         (None, 4, 4, 2048)   0           ['conv5_block2_out[0][0]',
+                                                                  'conv5_block3_3_conv[0][0]']
+ post_bn (BatchNormalization)   (None, 4, 4, 2048)   8192        ['conv5_block3_out[0][0]']
+ post_relu (Activation)         (None, 4, 4, 2048)   0           ['post_bn[0][0]']
+ flatten_12 (Flatten)           (None, 32768)        0           ['post_relu[0][0]']
+ hidden (Dense)                 (None, 512)          16777728    ['flatten_12[0][0]']
+ batch_normalization_25 (BatchN  (None, 512)         2048        ['hidden[0][0]']
+ ormalization)
+ input_26 (InputLayer)          [(None, 29)]         0           []
+ arcfacelayer_12 (Arcfacelayer)  (None, 29)          14848       ['batch_normalization_25[0][0]',
+                                                                  'input_26[0][0]']
+ dense_12 (Dense)               (None, 29)           870         ['arcfacelayer_12[0][0]']
+==================================================================================================
+Total params: 40,360,456
+Trainable params: 40,313,986
+Non-trainable params: 46,470
+__________________________________________________________________________________________________
+```
 ### 試したこと
 調べたところ，最後の畳み込み層(conv層)を指定するとよいとのことでしたので，最後から11層目の"conv5_block3_3_conv"をしていたのですが，その一つ手前のconv5_block3_outなどでもGradCAMは生成されるので，どの層を指定するべきなのかが分からなくなってしまいました.

Keras 深層学習 CNN (Convolutional Neural Network)機械学習 Python

本文追加

2023/01/28 18:46

投稿

harug

スコア28

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,1 +1,16 @@
+### 実現したいこと
+GradCAMの実装についてです.
+ResNet50v2のどの層から特徴量の抽出を行えばよいのかが分かりません.
+以下に，現在使用しているmodelのアーキテクチャをお見せします.
+とても長いですが，注目すべきは最後の方の層だと思います.(念のため全て載せます)
+### ResNet50v2のsummary
+### 試したこと
+調べたところ，最後の畳み込み層(conv層)を指定するとよいとのことでしたので，最後から11層目の"conv5_block3_3_conv"をしていたのですが，その一つ手前のconv5_block3_outなどでもGradCAMは生成されるので，どの層を指定するべきなのかが分からなくなってしまいました.
-あああああああああああああああああああああああああああああああああああああああああああああああああああああああああああああああああああああああああ
+ResNet50v2の場合はこのままconv5_block3_3_convを設定すればよいのでしょうか.

Keras 深層学習 CNN (Convolutional Neural Network)機械学習 Python