計算量の削減のために11畳み込みをすることを、いろいろなネットワークで見ます。
チャンネル数を任意の物にできてかつ、次元削減、パラメータ減らせるといいことばかりのようですが、チャンネル数が極端に少なくなると特徴が無くなるような気がしました。
11畳み込みをする場合のチャンネル数はどのように指定しているのでしょうか?明確な基準はありますか?
説明が分かりづらいと思うので、例を出します。例えば、以下URLのような場合です。
https://axa.biopapyrus.jp/deep-learning/cnn/1x1_convolution.html
このサイトだと、「入力データ1414480に対して、55のフィルターそのまま畳み込むより、先に11畳み込みしてチャンネル数16にして5*5畳み込みした方がパラメータ減っていいよ」ということを説明してくれてますが、このチャンネル数16にした段階で情報がなくなったり、精度が落ちたりしないのかなと考えました。
回答よろしくお願いします。
回答1件
あなたの回答
tips
プレビュー