画像認識において、1つの画像中に対象となる画像は複数含まれる場合、
対象となる画像が「ありそうな部分」を確定し、その上で画像認識を行う必要がありますが、
これは、
画像をいくつかの領域に分割
↓
分割した画像同士の類似度を計算(NN使う?)
↓
類似度が同じもの同士を結合
↓
結合した範囲を囲む
といった手順で行われるのが最新の方法なんでしょうか?簡単には。
これを簡単なコードで実装したいのですが、
画像をいくつかの領域に分割し、複数画像を作成するという手順は簡単にできそうです。
画像の類似度計算は、たぶん各画像でスコアを算出し、スコアが近い隣り合う画像を類似のものと認識していくのだと思うのですが、どのように実際は行っているのかという点、スコアにはどのようなパラメータ設定を行っているのかについては謎です。
結合について、これも簡単にできそう、結合した範囲を囲む事についても同様です。
あなたの回答
tips
プレビュー