研究でCNNを用いた多クラス分類問題を扱っているのですが、
論文に理論を書く際にDropoutについての説明が違うと言われ困っています。
Dropoutを行うことで訓練データが提示される度にユニットの出力をランダムで0にするので訓練データ提示のたびにネットワーク構造が代わり、それらのネットワーク出力の平均が最終的な出力になることからアンサンブル学習のような効果が得られるため汎化性能が高まる。
といったように理解していたのですが、実際には1つのネットワークに対して出力の平均を出すことはできないのでアンサンブル学習を用いた説明はできないとのことで現在は、多クラス分類におけるDropoutの効果を説明するように求められ、
学習時に一部のユニットのみを用いて出力を計算し、重みを更新することで、一部の重みでも正しい出力を出せるように学習が行われることが非常に重要であること。
分類問題においてはクラスに属する全ての訓練データに共通する部分を学習できること。
以上の2点がDropoutにおける重要な効果であり、その理由を説明するように求められ勉強を続けていますが、一向に理解が及びません...
情報があればご教授お願いします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/11/14 05:54
2019/11/14 06:42
2019/11/14 08:59