表題の件について質問させてください
現在画像の2値分類について学習しています
使用しているフレームワークはkerasです
データ全体は200枚(正常:100枚 異常:100枚)
訓練データは120枚(正常:60枚 異常:60枚)
検証データは40枚(正常:20枚 異常:20枚)
テストデータは40枚(正常:20枚 異常:20枚)
というふうにフォルダにあらかじめ配置してflow_from_directoryを
使ってデータを作成しています
モデルを学習させるためにfit_generatorを使用するのですが
その際に指定するパラメータは以下のように指定しています
python
1history = model.fit_generator(train_generator, 2 steps_per_epoch = 8, 3 epochs = 30, 4 validation_data = validation_generator, 5 validation_steps = 5, 6 callbacks=[check_point, lr_decay])
このパラメータについてドキュメントを読んでもいまいち理解できなかったので内容について教えて頂きたいのですが
①steps_per_epoch は訓練データセットを1バッチいくつにするかという認識であっていますでしょうか?(上の例では1バッチ15サンプルを8つ)
②validation_steps はモデル検証時に使われるサンプル数をいくつにするかという意味でしょうか?これが一番よく分かりません・・・(上の例でいうとモデルの検証に8サンプルを使う?)
検証データのバッチ数は訓練データのバッチ数に合わせた方が良いですか?
③steps_per_epoch (1バッチのサンプル数)を決める基準は何かありますか?
大きすぎると局所的最適解にとらわれやすいと記事などで見たことがあるのである程度小さくしたのですが決める目安などがあれば教えて頂きたいです
初歩的な質問で申し訳ありません
アドバイス頂けたら幸いです
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/03/25 01:09
2019/03/25 03:30 編集
2019/03/25 07:58
2019/03/25 11:57
2019/03/26 01:19