
物体検出に興味があり、その中でも比較的簡単そうなYOLOに挑戦したいと思っています。
主に以下のサイトを参考にさせていただいているのですが、自分の解釈が合っているのかや疑問についてご教授頂きたいです
http://tech-blog.abeja.asia/entry/object-detection-summary
【自分の解釈yoloに対する解釈】
まず、画像を任意の個数に分割します。
この記事では77で行っているので、以降は77で分割を行っている前提とします
↓
そして49個のブロックに対して、これが何の物体なのか、もしくはただの背景なのかを分類問題で学習させていきます。
↓
それと同時に、検出させたい物体の各ブロックに対して、真ん中を中心として、囲う線までの距離を回帰問題として学習させていきます。
この画像であれば、緑色の点が中心点とすれば、それぞれの緑色の点から水色の線まで、上下左右どのくらいの距離があるのかを学習させていく
ここまでが自分の解釈なのですが合っているでしょうか?
【疑問点】
yoloの弱点として、1つのブロックに対して、1クラスしか分類できないというのはわかるのですが、検出できる物体の数は2つという制約を設けているというのはどういう意味なのでしょうか?
この記事の画像では、犬と自転車の線が被っているブロックがいくつかありますが、同じブロックで3つの線を囲う事は出来ない、という事で合っていますか?
また各ブロックが示した矩形回帰は必ずしも均一になるわけではないと思うのですが、これは平均値を取って矩形を描写させるという事でいいでしょうか?
また矩形回帰の欠損値は二乗和誤差でいいのでしょうか?
詳しい方いらしたらよろしくお願いします

回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
退会済みユーザー
2017/07/25 21:44
2017/07/26 03:43
退会済みユーザー
2017/07/26 07:37