実現したいこと
コンピュータビジョンのMOT(Multi-Object Tracking)/Re-IDに詳しい方にぜひご意見いただきたいです。
小規模小売店舗の天井設置カメラ1台(固定・896x512@10fps)で、来店客の滞在時間・動線・ゾーン分析を行うバッチ処理システムを開発中です。
リアルタイム処理は不要で、1日分(営業10時間程度)の映像を夜間にまとめて処理する想定です。
現在のパイプライン
検出:YOLO11m
追跡:BoT-SORT + OSNet Re-ID(boxmotライブラリ使用)
+追跡がうまくいき次第、性別・年齢などの属性情報判別も機能として追加する予定です
Re-IDの限界を感じており、特に遮蔽後のID継続が大きなボトルネックになっています。
発生している問題・分からないこと
主な課題:遮蔽後のID再割当て失敗(ID分裂)
text人物が棚や他の客の背後に完全に隠れ、30フレーム(約3秒)検出されなくなった後、再出現時に別IDが振られてしまう
添付写真を参考にして頂きたいのですが▼
ID2が付与された人物は問題なく追跡ができています。
一方でID11が付与された人物については
手前のID10人物によって数秒間遮蔽される間に矩形(bbox)が消失し、再度出現した時にIDが15など異なったものに変化してしまいます。
該当のソースコード
特になし
試したこと・調べたこと
- teratailやGoogle等で検索した
- ソースコードを自分なりに変更した
- 知人に聞いた
- その他
上記の詳細・結果
自分で試したこと▼
以下の対策をすべて実施しましたが、効果はありませんでした。
①Re-ID特徴量の遮蔽直前汚染対策(IoMin重複検出+EMA alpha変更)
②appearance_thresh の緩和(0.25 → 0.4)
③BoT-SORTのproximity_threshマスクをlost track限定で無効化(Re-IDマッチング自体は有効化されたが、3秒後の特徴量距離が閾値を超えてマッチ不成立)
補足
特にお聞きしたいこと▼
遮蔽の問題について、以下の点をお聞きしたいです。
アルゴリズム側(Re-IDのさらなる改善や他の手法)ではどうにもならず、そもそもカメラ1台という構成自体が物理的に難しいものなのでしょうか?
それとも、アルゴリズムでまだ改善の余地があるのでしょうか?
あなたの回答
tips
プレビュー