画像検索テクニックの主流であるCNNについてご質問します.
任意の検索対象画像から猫を検出するAIプログラムを作成する場合,つぎのような手順になると思います.
➀猫と猫以外の学習画像ファイルを多数集める.
➁集めた学習画像ファイルの特徴量をCNNで圧縮(畳み込み+プーリング)する.
➂圧縮した画像を機械学習(猫と猫以外に分類)する.
➃学習結果をもとに,検索対象画像の中から猫を検出する.
ここで,➀~➂まではO'REILLYやネットで勉強して概要は理解できていると思っているのですが,➃について理解できておらず質問します.
検索対象である元画像から適当な位置と大きさの矩形領域の画像を多数抜き出して,それを学習結果と比べて猫か否かを判断すると思いますが,この時,元画像から抜き出した画像もCNNで圧縮するのでしょうか.もしくは,抜き出した画像はCNNで圧縮することなく生画像のままなのでしょうか.これが第一の疑問です.
第二の疑問として,おそらくどちらの方法もありで,適当に使い分けているのかなと予想しているのですが(単なる想像です),つぎのような疑問があります.
1)抜き出した画像もCNNで圧縮する場合
計算量が膨大になり,静止画であればともかく,動画に適用するのは難しいのではないか.
2)抜き出した画像は圧縮せず,そのままの生画像の場合
CNNで圧縮して機械学習した結果と,圧縮しないそのままの生画像を比べることで,精度良く猫を検出できるのか.
畳み込みに用いるフィルターについても疑問があるのですが,まずは,上記の疑問に助言してもらえると助かります.
宜しくお願いします.
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/04/01 21:16
2020/04/02 02:27
2020/04/03 22:49