CNNなどのニューラルネットワークでの出力の直前に、全結合をつけることがあります。
この場合、ミニバッチでサンプリングしたデータは、全てn次元に整理されてしまいます。
画像処理の場合、1、2、3、・・・といった手書き数字画像がサンプリングされた場合、畳み込み層ではチャンネルが別れているので、理屈がわかるのですが、全結合層では、全部が、一つの列におさまって出力へと向かいます。なぜ、これで学習できているのかわかりません。学習する際の出力は、Softmaxで得られた確率なので、0-9 までのどれか一つになるはずです。例えば5、7、0、3、という4つのバッチデータがあった場合どうやって、学習しているのでしょうか。

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。