DeepLearning CNN 画像のサイズについて

CNNで画像分類をやろうと考えています。

現在、画像を収集している段階なのですが、画像のサイズが様々あり、リサイズする必要があります。

そこでなのですが、学習に都合の良い画像サイズというものはそんざいするのでしょうか？もちろん画像が大きくなると特徴も大きくなり計算量も多くなると思います。ですので、学習に必要な最低限の画像サイズを教えていただけると嬉しいです。

t_obara

2017/09/19 09:15

特徴量と分類との関係性に依存するため、学習してみないとなんともというところだと思います。一般的に自然画像だと大きなサイズが必要そうですが、分類数が少なければ多くの特徴量が不要になるので、小さくても良いということにもなります。

行動規範の内容に同意します

回答4件

私も気になる質問ですし、このまま未解決・未回答のまま埋もれてしまう（掘り返さない限り読み返されない）のは悔しいですし、もっと詳しい方の回答が得られることを期待して書きます。

それっぽいキーワードで検索すると、大半が電気代と性能のトレードオフ止まりの情報しか呈示していませんでした。このような中、あきらめずに探すとQuoraの質問に至ります。

2017-11-16 A.M
以前書き込んだ際は残っていたのに、なぜか消えた95% の部分をうろ覚えで復旧

■Tim Dettmersさん
*高解像度化 VS 深層化

	高解像度化	深層化
代表例	BaiduVision	ResNet

高解像度化は確かにパフォーマンスを改善できるが、だからといって高解像度化をすることがパフォーマンス（精度）を常に改善できるとは限らない。もし、低解像度で十分に判別できるのであれば、高解像度化しても情報量が無駄に多いだけだ。

一般論として、高解像度化するよりも深層化した方が、計算コストは安くて済む。（BaiduVision vs ResNetの関係）

■Chomba Bupeさん
*適切な解像度

	鮮明に撮影	不鮮明に撮影
グローバル特徴`global feature`	軽視	重視
細かい特徴`finer feature`	重視	軽視

∴トレードオフの関係があり、「どの解像度が良い」という万能なものは存在しない

*グローバル特徴と細かい特徴の活かし方
だからこそ、コンピュータビジョンにおいて、どのような特徴がどうやって（広い範囲なのか狭い範囲なのか）入ってくるのか分からない認識問題では（鮮明さの違いという意味で）複数の解像度で処理するのが望ましい。

・プーリングについて
CNNでのプーリングは「複数解像度での処理」に対応する手法ではあるが、スケールスペース分析scale space analysisとは異なっている。

・スケールスペース分析について
さまざまな解像度（詳細・粗い）での特徴量を学ばせるのであれば、プーリングよりもCNNにイメージピラミッドを送る方が効果的だろう。（プーリング抜きの）CNNにいろいろな解像度、いろいろな方向の画像を食わせて、最後（だけ）Maxpoolingして答えを統合するのもありだろう。
と、いう感じで、スケールスペース（綺麗、粗い）を変えて学習させる手法は、計算コストはかなり高くつくけれども、精度UPはきっちり見込めるはずだ。

■Gianluca Nanさん
認識できる最小限の解像度が良いでしょう。手書きの数字を認識するのに255*255の画像ではもったいないし、処理が重くなります。

以下、私の考えです。
という感じで、「この条件がベストだ！」と具体的に数値やグラフで示されているデータはなさそうです。恐らくもっとも洗練された汎用認識システムは人間ですので、人間が見てわかりにくい解像度のデータは入力としてあんまりよくない気がします。

ですので、私がもしやるのであれば、以下の感じでしょうか。
・まずは少し大きめの画像を保存する（生データ）
・集まった画像をぼーっと眺める
・これくらいならわかるかな？というサイズの最小限のサイズにリサイズする
・実際に走らせる
・アタリが悪そうなら、先に保存した生データを最小限のサイズ+αにリサイズして実際に走らせる

投稿2017/11/11 04:36

編集2017/11/15 22:37

退会済みユーザー

総合スコア0

退会済みユーザー

2017/11/15 21:41 編集

今日気づいたのですが、頑張ってまとめたのに文章の9割5分くらいが消えた謎…

行動規範の内容に同意します

コンピューターでの論理演算の仕組みを考えると、画像のサイズが2の累乗の時は計算が早くなる気もしますが、大きな差は出ないかもしれません。

投稿2017/12/17 16:19

futashige

総合スコア28

画像劣化とリサイズだと意味がちょっと違うかもしれませんが参考程度に[Survey]Understanding How Image Quality Affects Deep Neural Networks

投稿2017/11/15 23:02

wakame

総合スコア1170

問題の複雑さに対して最低限必要なデータ数または高々どのくらいで概ね正しく学習ができるのかというような数学的な議論は存在しますが、実際にプログラムを組んで学習させる立場の人から見るとあまり参考にならない程度のことしか言うことができません。現在の知見ではt_obaraさんの言うように、人間の手で泥臭くうまい設定を探すことになるのではないでしょうか？

投稿2017/11/15 19:18