CNNの過学習の要因として計算量のほとんどは畳み込み演算であるため.
全結合層のパラメータ数を減らせばいいと, なくせばいいと済む話と単刀直入に思ったのですがネットや資料をみるとDense(1024), Dense(4096)などよくみるので
① 全結合層がある利点, メリットはなんですか?また, 全結合層をなくすとパラメータ数が減るのは分かりますが, デメリットなどありましたら教えていただきたいです。
またVGGでは3*3の畳み込みを何度か繰り返し,畳み込み層数を倍にするという作業をやっていますが
② 畳み込み層数を倍にするメリット・デメリットがありましたら教えてください。
③ 畳み込み層の層の数を変えることによってパラメータ数が変わっていくと思いますが,過学習に影響するかどうかも教えていただきたいです。
いろいろ曖昧なことばかりで質問だらけになってしまいすみません。
どなたか力を貸していただけるとありがたいです。

回答1件
あなたの回答
tips
プレビュー