はじめまして。
最近、機械学習の勉強を始めた者です。
物体検出メソッドYOLOについて調べているのですが、
アルゴリズムでどうにも分からない部分があり質問させて頂きます。
YOLOの検出の序盤は
・画像を7×7に分割
↓
・それぞれのグリッドセルに対し、二つのバウンディングボックスと一組のクラス確率を予測
……という流れだと思っています。
では、そのバウンディングボックスをどうやって検出しているのか?
というのが直感的に分かりません。
論文などを読んだ限り、スライディングウィンドウやリージョンプロポーザルは使っていなさそうなのですが。
どなたか詳しい方、回答して頂けるとありがたいです。
YOLOv1の話ですか?