質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.39%
Chainer

Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

4回答

33103閲覧

DeepLearning CNN 画像のサイズについて

_Victorique__

総合スコア1392

Chainer

Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

3グッド

8クリップ

投稿2017/09/19 06:40

CNNで画像分類をやろうと考えています。

現在、画像を収集している段階なのですが、画像のサイズが様々あり、リサイズする必要があります。

そこでなのですが、学習に都合の良い画像サイズというものはそんざいするのでしょうか?もちろん画像が大きくなると特徴も大きくなり計算量も多くなると思います。ですので、学習に必要な最低限の画像サイズを教えていただけると嬉しいです。

ZENZAI, shimitei👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

t_obara

2017/09/19 09:15

特徴量と分類との関係性に依存するため、学習してみないとなんともというところだと思います。一般的に自然画像だと大きなサイズが必要そうですが、分類数が少なければ多くの特徴量が不要になるので、小さくても良いということにもなります。
guest

回答4

0

私も気になる質問ですし、このまま未解決・未回答のまま埋もれてしまう(掘り返さない限り読み返されない)のは悔しいですし、もっと詳しい方の回答が得られることを期待して書きます。


それっぽいキーワードで検索すると、大半が電気代と性能のトレードオフ止まりの情報しか呈示していませんでした。このような中、あきらめずに探すとQuoraの質問に至ります。

2017-11-16 A.M
以前書き込んだ際は残っていたのに、なぜか消えた95% の部分をうろ覚えで復旧


■Tim Dettmersさん
*高解像度化 VS 深層化

高解像度化深層化
代表例BaiduVisionResNet

高解像度化は確かにパフォーマンスを改善できるが、だからといって高解像度化をすることがパフォーマンス(精度)を常に改善できるとは限らない。もし、低解像度で十分に判別できるのであれば、高解像度化しても情報量が無駄に多いだけだ。

一般論として、高解像度化するよりも深層化した方が、計算コストは安くて済む。(BaiduVision vs ResNetの関係)


■Chomba Bupeさん
*適切な解像度

鮮明に撮影不鮮明に撮影
グローバル特徴global feature軽視重視
細かい特徴finer feature重視軽視

∴トレードオフの関係があり、「どの解像度が良い」という万能なものは存在しない

*グローバル特徴と細かい特徴の活かし方
だからこそ、コンピュータビジョンにおいて、どのような特徴がどうやって(広い範囲なのか狭い範囲なのか)入ってくるのか分からない認識問題では(鮮明さの違いという意味で)複数の解像度で処理するのが望ましい。

・プーリングについて
CNNでのプーリングは「複数解像度での処理」に対応する手法ではあるが、スケールスペース分析scale space analysisとは異なっている。

・スケールスペース分析について
さまざまな解像度(詳細・粗い)での特徴量を学ばせるのであれば、プーリングよりもCNNにイメージピラミッドを送る方が効果的だろう。(プーリング抜きの)CNNにいろいろな解像度、いろいろな方向の画像を食わせて、最後(だけ)Maxpoolingして答えを統合するのもありだろう。
と、いう感じで、スケールスペース(綺麗、粗い)を変えて学習させる手法は、計算コストはかなり高くつくけれども、精度UPはきっちり見込めるはずだ。


■Gianluca Nanさん
認識できる最小限の解像度が良いでしょう。手書きの数字を認識するのに255*255の画像ではもったいないし、処理が重くなります。


以下、私の考えです。
という感じで、「この条件がベストだ!」と具体的に数値やグラフで示されているデータはなさそうです。恐らくもっとも洗練された汎用認識システムは人間ですので、人間が見てわかりにくい解像度のデータは入力としてあんまりよくない気がします。

ですので、私がもしやるのであれば、以下の感じでしょうか。
・まずは少し大きめの画像を保存する(生データ)
・集まった画像をぼーっと眺める
・これくらいならわかるかな?というサイズの最小限のサイズにリサイズする
・実際に走らせる
・アタリが悪そうなら、先に保存した生データを最小限のサイズ+αにリサイズして実際に走らせる

投稿2017/11/11 04:36

編集2017/11/15 22:37
退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2017/11/15 21:41 編集

今日気づいたのですが、頑張ってまとめたのに文章の9割5分くらいが消えた謎…
guest

0

コンピューターでの論理演算の仕組みを考えると、画像のサイズが2の累乗の時は計算が早くなる気もしますが、大きな差は出ないかもしれません。

投稿2017/12/17 16:19

futashige

総合スコア28

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

画像劣化とリサイズだと意味がちょっと違うかもしれませんが参考程度に[Survey]Understanding How Image Quality Affects Deep Neural Networks

投稿2017/11/15 23:02

wakame

総合スコア1170

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

問題の複雑さに対して最低限必要なデータ数または高々どのくらいで概ね正しく学習ができるのかというような数学的な議論は存在しますが、実際にプログラムを組んで学習させる立場の人から見るとあまり参考にならない程度のことしか言うことができません。現在の知見ではt_obaraさんの言うように、人間の手で泥臭くうまい設定を探すことになるのではないでしょうか?

投稿2017/11/15 19:18

Paalon

総合スコア264

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.39%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問