pytorchを用いた物体検出モデルの自作datasetについて

datasetを作成するとき、説明変数と目的変数変数のペアで作成すと思うのですが、物体検出のように1枚の画像に複数の目的変数（検出したい物体が犬の場合、画像の中に２匹いる、）がある場合はどのような感じで作れば良いでしょうか。

私が考えるに、
image01 に2匹の犬が写っている
image02 に1匹の犬が写っている　
としたら、

のようにimage01を複数つくる必要があると考えているのですが、あっていますでしょうか。

sn__0055

2023/04/03 08:28

失礼しました。物体検出モデルはFaster R-CNNの方を考えています。アノテーションデータの方はcocoデータにも使われているxmlファイルです。Faster R-CNNもYOLOと同じdatasetの作成法で問題ないでしょうか。

jbpb0

2023/04/12 23:19

そういうことは、ここに書くのではなく、質問を編集して追記してください

jbpb0

2023/04/13 00:20 編集

> 物体検出モデルはFaster R-CNNの方を考えています。使う予定のコードが一般に公開されてるものなら、それの情報も質問に追記してください (コードのgithubのurlや、コードの使い方の解説記事のurl等)

行動規範の内容に同意します

回答1件

「pytorchを用いた物体検出モデル」にもいろいろあり、アノテーションデータのファイルの書き方もそれぞれ違うでしょうから、どれを実行したいか具体的に書かないと何とも言えません

たとえばyoloでは、画像ファイルとアノテーションデータのテキストファイルをペアで用意しますが、一つの画像ファイルに検出したい物体が複数有る場合は、
YOLOによる画像内物体の検出技術の「3. Training Dataset」
で説明されてるように、その画像ファイルに対応するテキストファイルに複数行(一つの物体が一つの行)書きます

投稿2023/04/02 06:08

jbpb0

総合スコア7658