質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.51%

  • 機械学習

    956questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

  • TensorFlow

    917questions

  • 深層学習

    217questions

CNNで異なるサイズのobject認識問題

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 3,102

IS.SEKI

score 18

 前提

CNNで物を認識する場合対象のサイズに依存することは分かりました。
ところがTEST画像の中に認識してほしいobjectのサイズは必ずしもCNNをトレーニングするに使われる学習画像中の対するobjectのサイズと一致する訳ではない。
そのために、●「複数のサイズの異なるobject画像をCNNに学習させればOK」という説がありました。

 質問の内容

質問1
CNNの入力に画像サイズまちまちで可能でしょうか。
まちまちで不可能であれば、どうやって異なるサイズのobject画像を学習させるのでしょうか。

質問2
仮に、異なるサイズのobject画像をCNNに入力できるとします。
そうしたら、同じobjectであってもobjectの画像サイズが違えれば、CNN自身が画像のscale不変特徴量を抽出できないので、objectの特徴が全然違う事になります。
つまり、多量の異なる特徴量に同じラベルを持つ事になります。
それに多量のラベルが存在します。
このような状況にNNが混乱しないでしょうか-----どうして耐えられるのでしょうか。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

+1

予め画像を一定の大きさにリサイズして学習するか、poolingするときにリサイズするのはどうでしょうか?

https://arxiv.org/abs/1406.4729

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/03/17 12:57 編集

    アドバイスとリンク有難うございます。
    https://arxiv.org/abs/1406.4729
    面白しろそうで、じっくり読ませていただきます。

    ただ、
    > 予め画像を一定の大きさにリサイズして学習するか
    についてちょっと理解できません:
    例えばサイズA1の人間の頭部画像とサイズA2、A3の人間の頭部画像があるとします。
    A1とA3の画像サイズをA2の画像サイズにリサイズ すれば、結局頭部画像は皆A2サイズになり、
    objectサイズの多様化にならないですね。
    私は誤解していますか?

    キャンセル

  • 2018/03/17 15:22

    前処理で部分を切り出すか、拡大・縮小しています。全体の入力ピクセル数は固定していますが、画像がそれをどのように占めるのかという自由度があります。

    キャンセル

  • 2018/03/19 11:15

    mkgrei 様 回答ありがとうございます。
    > 全体の入力ピクセル数は固定していますが、画像がそれをどのように占めるのかという自由度があります。

    頭悪くて、以下の事でしょうか。確認させてください。

    入力画像物理的なサイズ同じですが、中の対象物自身の画像の大きさを自由に変動させるという事ですね?   そうすると、背景の領域や内容も変動的になりますね。
    NN自身は何が前景、何が背景知らないので、これで対象物の特徴を取得できるのでしょうか。
    逆に言えば、背景の特徴をトレーニングする事になるのではないでしょうか。

    キャンセル

  • 2018/03/19 11:40

    「背景」が何かという問題にもなります。
    分類しようとするものがいつも何かの背景と一緒に写っているのであれば、それはもはや背景とは呼び難いです。
    背景の特徴をトレーニングしてしまわないかというのは、サイズを変更しない場合でも起こりうる心配です。

    それともいま背景と仰られているのは例えば対象物の画像の大きさが入力よりも小さくなった時にその余白を埋めるためのピクセルということでしょうか?
    さじ加減にもよると思いますが、異なるクラスでも同様な余白を持ちうるので、余白の形を学習してしまった場合精度が著しく低下しそうです。(なので精度が低下するようには学習しないと思います)

    多少のデータ拡張をすると少しやるとトータル精度が上がります。
    やりすぎるとトータル精度は今度下がっていきます。
    お試しになると感覚がつかめると思います。
    回転角を90度とかにするとトータル精度ががんがん下がります。
    ここで「トータル精度」とわざわざ書いてあるのは、もとより回転したものについては精度は少し上がるが、もともと回転していないものの精度が下がる、ことを念頭に置いています。
    これは擬人的に「NNが混乱した」ことになります。

    キャンセル

  • 2018/03/21 11:49 編集

    mkgrei 様
    非常に具体的なご解説有難う御座いました。

    キャンセル

同じタグがついた質問を見る

  • 機械学習

    956questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

  • TensorFlow

    917questions

  • 深層学習

    217questions