#Faster R-CNNのRPNのRPNの学習が理解できない
Faster R-CNNの勉強をしています。
いくつかのサイトを見ているのですが、RPNの学習で理解できないとこりがありました。
以下、読んでいるサイトです。
サイト①
サイト②
サイト③
###実際の物体領域(ground truth)はラベル付けしておかないといけないのか?
サイト①に以下のように書かれています。
元論文に書かれているように、RPNでは
・あるAnchor boxの中身が背景か物体か
・物体だった場合、ground truthとどのくらいズレているか
の2つを学習させます。
この説明自体は理解できたのですが、ここでground truth
をラベル付けしなければいけないのか?と疑問に思いました。
RPNが学習する際にはground truth
はわからないのでここでは人によるラベル付け必要なはずです。
しかし、これはMNISTのラベル付けよりもはるかに大変な作業なはずです。
MNISTが一枚の画像に大して正解ラベルが1つ何に対し、RPNでは画像一枚に少なくとも物体が1つ以上存在すると考えて、物体の個数*頂点の座標分ラベルを与えなくてはいけないはずです。
###それとも学習済みRPNを使用するのか?
それとも、RPNは一度作ってしまえば、物体がある領域を提案し、設定しておいたAnchor box
の中から一番合うAnchor box
を選ぶだけなので使い回しが効くのでしょうか?
研究や開発の際には学習済みのRPNを使うのでしょうか?
サイト④のmodels/faster_rcnn.pyの42行目に
self.RPN.train = False
とあるのでそうなのかなと思いました。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/08/28 14:04 編集