質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

91.36%

  • TensorFlow

    282questions

  • 機械学習

    269questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

  • Keras

    33questions

CNNの幾何変換に対するロバスト性は?

解決済

回答 1

投稿 2017/11/30 11:06

  • 評価
  • クリップ 1
  • VIEW 63

oookabe

score 4

こんにちは

CNNに関するもっとも基本的な質問ですけれども、

Q1: training image とtest imageの間に回転関係があっても大丈夫でそうか。

Q2: training image とtest imageとの大きさが違っても大丈夫でしょうか。

Q3: training imageのサイズがまちまちでも大丈夫でしょうか。

Q4: pooling処理に入力画素の位置とそれに対応する出力画素の位置関係が回転関係(角度を指定して)に指定する事は可能でしょうか。

ご教授宜しくお願い致します。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

0

教育的な質問ですね。
認定試験のテストに出そうです。

Q1,2 回転、拡大・縮小に対してロバストになるように画像を前処理して教師データを生成します。
https://keras.io/ja/preprocessing/image/
許容範囲についてはデータ次第でしょうか。
学習時に許される回転角を大きくしすぎると学習自体の精度が劣化したような記憶があります。

Q3 大きさが足りなければ、拡大するか、真ん中に貼り付けるか。はみ出したら、縮小するか、切り出しするか。好みの問題ではないでしょうか。

Q4 できなくはないと思いますが、実装が大変そうですね。回転角は学習の途中で変化するのですか。する場合どの向きに回転させるべきかが一意に決まらないように感じます。変化させないのなら、元のデータを回転すればよいので。あまりご利益はなさそうですが、特別な状況を想定しているのでしょうか。

投稿 2017/11/30 19:14

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/11/30 22:33

    早速お返答ありがとうございます。
    工業検査分野において認識対象物(work)のポーズはランダム的である場合が多いです。
    そのためにありとあらゆる画像の回転×伸縮サンプルを用意するのは大変ですね。
    ーーーー理論上無限に多い。。。
    これに伴って、ネットのパラメータも莫大に増殖しなかれば、特徴を記憶できないはず。
    トレーニング時間と結果は気になります。
    (人間のニューラルは認識するために決してこんなに学習サンプルを必要としません。)

    対策として、例えば初期のpoolingで、指定範囲の画像の幾何変換を行って、省力化を図りたいです。
    実装は複雑になりますが、汎用性があるので、成功した実装を皆利用すれば良い話で、各利用者が毎回沢山サンプリングを用意するより、社会全体が能率良くなります。
    何か良いアイディアをいただけませんか。

    キャンセル

  • 2017/11/30 22:44

    モチベーションは理解しました。
    確かにそのようなケースでは平面的な認識は難しいですね。
    立体物のポーズの複雑性を解決するため点群カメラを用いた3次元マッチングはいかがですか。

    キャンセル

  • 2017/12/01 07:47

    「3次元マッチングはいかがですか」
    人間の画像処理---特徴抽出およびマッチングは大変だからこそ、CNNの存在価値が認められたわけですね。
    もし、CNNがobjectを認識するために、そのobjectの遍歴的なポーズ画像を必要とすれば、これもまた大変そうですし、それに果たして一つのNNでの学習効果はどうなるかと気になります。
    何せ、人間の頭脳とかニューラルの動きとは全然違いますね。
    仮令雀であっても、ある種類の虫を認識するために、その虫のありとあらゆるポーズを事前学習する事はしないでしょう。
    それに、これまでは人間の画像処理より、ありとあらゆる角度のobject画像写真を用意しなくても、それなりの認識能力を有する成果がありました。
    それは局部特徴の総合(特徴量の統計と特徴点位置関係の統計)と大局的な特徴の概括(幾つかの典型をモデル化など)による実現されたのです。
    このへん、CNNのほうは本当にどうなっているのでしょうか。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

ただいまの回答率

91.36%

関連した質問

  • 解決済

    ピクセルごとの画像分類 (CNN)

    私は現在、大学で Convolutional Neuron Network について勉強しています。本回はピクセルごとの画像分類 FCN に関して質問があり投稿させていただきました

  • 受付中

    CNNの回帰問題の論文やサイトを知りませんか?

    畳み込みニューラルネットワーク(CNN)で画像に存在する物質の個数を求めるために、回帰を行いたいと思っています。その物質は重なっていたりするので、よく細胞のカウントで行われているよ

  • 解決済

    kerasを用いたCNNでの犬猫判別

    Mac OS Sierra 10.12.1 現在kerasを用いたCNNで犬猫判別をしています。 犬猫の画像を128*128(3チャンネル)にリサイズして ミニバッチを採用して

  • 解決済

    機械学習(CNN)の評価について

    O'Reilly Japan - ゼロから作るDeep LearningにあるCNNのソースを利用して、オリジナルのデータで学習をさせています。ソースで変更を加えているのは、画像の

  • 受付中

    DeepLearning CNN 画像のサイズについて

    CNNで画像分類をやろうと考えています。 現在、画像を収集している段階なのですが、画像のサイズが様々あり、リサイズする必要があります。 そこでなのですが、学習に都合の良い画

  • 解決済

    TensoeFlowの画像分類(CNN)の処理が分からない.

    以下のコードがどういった処理を行っているのかわかりません. TensorFlowを用いた画像分類のCNN法のコードなのですが,どういう方法でニューラルネットワークを構築しているのか

  • 受付中

    TensorFlowを用いた画像認識(CNN法)で用いる画像のサイズが分からない.

    以下のコードでCNNを用いたニューラルネットワークを構築する際,データセットの画像サイズを統一しなければならないか知りたいです. どなたか詳しい方教えて頂けませんでしょうか.

  • 受付中

    tensorflowのCNNとLSTMを使ったモデルでバッチ学習をしたい

    動画をCNNにかけてフレームごとの特徴を抽出して、そのあとLSTMを適用するモデルをtensorflowで作ったのですが、バッチサイズ分の動画を入力したらGPUのメモリが足りなくな

同じタグがついた質問を見る

  • TensorFlow

    282questions

  • 機械学習

    269questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

  • Keras

    33questions