疑問点
現在、Mask R-CNNを用いて、ある小さい果実の物体検出のモデルを作成しました。
モデルの精度評価を行うために、果実が生っている木全体の画像を推論させて果実の検出数を測定しているのですが、テスト画像をそのまま推論させるより、木の一部分をトリミングした画像を入力したほうが検出数が上がります。
トリミングしただけでは画像中に映る果実のピクセル数は変わらないと思いますがなぜ検出しやすくなるのでしょうか?
CNNへの理解不足かもしれませんが、ご教授願います。
あなたの回答
tips
プレビュー