wakame2018/01/15 09:05 編集認識するというのは細長い竿であるかを判別するのか、何かしらの長い棒のようなものがあるかを判断するかという二通りの解釈をしましたがどのように考えていますか。
oookabe2018/01/15 06:39mkgreiさま 2つのリンク両方とも面白いですね。 良い勉強になりました。 ただ、https://qiita.com/onlyzs/items/5096f50a21758a536d9aの中に、 CNNのpoolingは「オブジェクトの回転、移動に対する不変性です。」と書かれている以上 どうして、わざわざobjectの回転画像を用意してCNNに学習させる必要とするのでしょうか。 ものの全回転画像って数が莫大で非常に手間かかりますね。 何かイディア頂ければ幸いです。
mkgrei2018/01/19 04:27単純にpoolingのサイズの問題だと思います。 サイズが小さいと細部に囚われて汎化性能が出ません。 サイズが大きいと何もかもぼやけて見えてしまって区別がつきません。 その競合によってpoolingのサイズは決まるべきです。 すると左側にあるものを右側に持ってくるような不変性は持ち得ないことになります。 ならばと、教師データを歪ませてやればデータを余すことなく利用してやることができます。 ただこの回転・並進・拡大縮小も限度があります。 たとえば、回転角30まで含めると精度が上がるのに90以上回すと今度は精度が下がったりします。 極端な値を使った時に良い場合、パラメータになりません。 様々なことが競合して、適用対象に最適な値があることが価値であり、みんなが興味を持つことだと思います。