質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.51%

  • Python

    11719questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • 機械学習

    958questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

  • Chainer

    208questions

    Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。

DeepLearning CNN 画像のサイズについて

受付中

回答 4

投稿

  • 評価
  • クリップ 8
  • VIEW 8,954

_Victorique__

score 1167

CNNで画像分類をやろうと考えています。

現在、画像を収集している段階なのですが、画像のサイズが様々あり、リサイズする必要があります。

そこでなのですが、学習に都合の良い画像サイズというものはそんざいするのでしょうか?もちろん画像が大きくなると特徴も大きくなり計算量も多くなると思います。ですので、学習に必要な最低限の画像サイズを教えていただけると嬉しいです。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • t_obara

    2017/09/19 18:15

    特徴量と分類との関係性に依存するため、学習してみないとなんともというところだと思います。一般的に自然画像だと大きなサイズが必要そうですが、分類数が少なければ多くの特徴量が不要になるので、小さくても良いということにもなります。

    キャンセル

回答 4

+4

私も気になる質問ですし、このまま未解決・未回答のまま埋もれてしまう(掘り返さない限り読み返されない)のは悔しいですし、もっと詳しい方の回答が得られることを期待して書きます。


それっぽいキーワードで検索すると、大半が電気代と性能のトレードオフ止まりの情報しか呈示していませんでした。このような中、あきらめずに探すとQuoraの質問に至ります。

2017-11-16 A.M
以前書き込んだ際は残っていたのに、なぜか消えた95% の部分をうろ覚えで復旧


■Tim Dettmersさん
*高解像度化 VS 深層化

高解像度化 深層化
代表例 BaiduVision ResNet

高解像度化は確かにパフォーマンスを改善できるが、だからといって高解像度化をすることがパフォーマンス(精度)を常に改善できるとは限らない。もし、低解像度で十分に判別できるのであれば、高解像度化しても情報量が無駄に多いだけだ。

一般論として、高解像度化するよりも深層化した方が、計算コストは安くて済む。(BaiduVision vs ResNetの関係)


■Chomba Bupeさん
*適切な解像度

鮮明に撮影 不鮮明に撮影
グローバル特徴global feature 軽視 重視
細かい特徴finer feature 重視 軽視

∴トレードオフの関係があり、「どの解像度が良い」という万能なものは存在しない

*グローバル特徴と細かい特徴の活かし方
だからこそ、コンピュータビジョンにおいて、どのような特徴がどうやって(広い範囲なのか狭い範囲なのか)入ってくるのか分からない認識問題では(鮮明さの違いという意味で)複数の解像度で処理するのが望ましい。

・プーリングについて
CNNでのプーリングは「複数解像度での処理」に対応する手法ではあるが、スケールスペース分析scale space analysisとは異なっている。

・スケールスペース分析について
さまざまな解像度(詳細・粗い)での特徴量を学ばせるのであれば、プーリングよりもCNNにイメージピラミッドを送る方が効果的だろう。(プーリング抜きの)CNNにいろいろな解像度、いろいろな方向の画像を食わせて、最後(だけ)Maxpoolingして答えを統合するのもありだろう。
と、いう感じで、スケールスペース(綺麗、粗い)を変えて学習させる手法は、計算コストはかなり高くつくけれども、精度UPはきっちり見込めるはずだ。


■Gianluca Nanさん
認識できる最小限の解像度が良いでしょう。手書きの数字を認識するのに255*255の画像ではもったいないし、処理が重くなります。


以下、私の考えです。
という感じで、「この条件がベストだ!」と具体的に数値やグラフで示されているデータはなさそうです。恐らくもっとも洗練された汎用認識システムは人間ですので、人間が見てわかりにくい解像度のデータは入力としてあんまりよくない気がします。

ですので、私がもしやるのであれば、以下の感じでしょうか。
・まずは少し大きめの画像を保存する(生データ)
・集まった画像をぼーっと眺める
・これくらいならわかるかな?というサイズの最小限のサイズにリサイズする
・実際に走らせる
・アタリが悪そうなら、先に保存した生データを最小限のサイズ+αにリサイズして実際に走らせる

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/11/16 06:40 編集

    今日気づいたのですが、頑張ってまとめたのに文章の9割5分くらいが消えた謎…

    キャンセル

0

問題の複雑さに対して最低限必要なデータ数または高々どのくらいで概ね正しく学習ができるのかというような数学的な議論は存在しますが、実際にプログラムを組んで学習させる立場の人から見るとあまり参考にならない程度のことしか言うことができません。現在の知見ではt_obaraさんの言うように、人間の手で泥臭くうまい設定を探すことになるのではないでしょうか?

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

画像劣化とリサイズだと意味がちょっと違うかもしれませんが参考程度に[Survey]Understanding How Image Quality Affects Deep Neural Networks

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

コンピューターでの論理演算の仕組みを考えると、画像のサイズが2の累乗の時は計算が早くなる気もしますが、大きな差は出ないかもしれません。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

同じタグがついた質問を見る

  • Python

    11719questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • 機械学習

    958questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

  • Chainer

    208questions

    Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。