ニューラルネットワークで必要なノード数についてわからなかったので質問をさせて下さい。
10万の教師データがあった場合に、過学習をしてもいいとしてほぼ完璧な教師データの出力をさせるための最低ノード数はいくつになるのでしょうか?
まず、自分がいま自作したニューラルネットワークの構成では
①onehotの16入力を4つ⇒16×1000の重みとの行列積ををそれぞれ4つに対してとる⇒4つの結合の和を取る⇒スカラー
②onehotの20入力を4つ⇒20×1000の重みとの行列積ををそれぞれ4つに対してとる⇒4つの結合の和を取る⇒スカラー
③②をもう一つ
①~③を一つにまとめて(1,3)の行列式として、そこから(3,1000)⇒×(1000,1000)⇒×(1000,1)を通して最終的に1出力になるようにしています。
この誤差を回帰問題として二乗誤差で学習しているのですがある一定のところまで来ると誤差が全く減らなくなります。
これは10万個の教師データに対して隠れ層のノード数が少ないことが問題になるのでしょうか?
また、途中で(1,3)の形に変換していますが、これはいわば3入力でありここで多くの情報が失われてしまっているのでしょうか?
深さを1にしてノード数を10万にする単層ニューラルネットワークにしてみたのですがやはり学習がどこかで停滞しているように見えました。
構成の問題点などが見えてこないのでご教授頂けると嬉しいです。
あなたの回答
tips
プレビュー