回答編集履歴

一部修正

2021/10/10 00:27

投稿

スコア3266

answer CHANGED Viewed

@@ -2,7 +2,7 @@
 過学習の対策としては、以下が推奨されます。
-- データを増やす。  *データ拡張を含む（画像解析ではデータ拡張は常識的な手法）
+- データを増やす。  *データ拡張を含む（画像解析におけるデータ拡張は常識的な手法）
 - モデルを単純化する（与えられた問題やデータに対して、モデルが複雑すぎる）。
 - データの汎用的な特徴を捉えられるように、特徴量選択を工夫したり、モデルを見直したりする。  *ResNetもその1つ
 - 大量の類似分野のデータで学習済のモデルを元に、転移学習やファインチューニングをする。

一部修正

2021/10/10 00:26

投稿

スコア3266

answer CHANGED Viewed

@@ -2,11 +2,11 @@
 過学習の対策としては、以下が推奨されます。
-- データを増やす。  *データ拡張を含む
+- データを増やす。  *データ拡張を含む（画像解析ではデータ拡張は常識的な手法）
 - モデルを単純化する（与えられた問題やデータに対して、モデルが複雑すぎる）。
 - データの汎用的な特徴を捉えられるように、特徴量選択を工夫したり、モデルを見直したりする。  *ResNetもその1つ
 - 大量の類似分野のデータで学習済のモデルを元に、転移学習やファインチューニングをする。
-- BatchNormalizationを活用する。
+- BatchNormalizationを活用する。  *簡単に効果を得やすい
 - Dropoutを活用する。 *BNに対して効果は低く、補完程度の役割
 - 正則化する。 *古い教科書には記述されているが、ほぼ絶滅した手法

一部修正

2021/10/10 00:25

投稿

スコア3266

answer CHANGED Viewed

@@ -4,7 +4,7 @@
 - データを増やす。  *データ拡張を含む
 - モデルを単純化する（与えられた問題やデータに対して、モデルが複雑すぎる）。
-- データの汎用的な特徴を表現する特徴量選択を工夫したり、モデルを見直したりする。  *ResNetもその1つ
+- データの汎用的な特徴を捉えられるように、特徴量選択を工夫したり、モデルを見直したりする。  *ResNetもその1つ
 - 大量の類似分野のデータで学習済のモデルを元に、転移学習やファインチューニングをする。
 - BatchNormalizationを活用する。
 - Dropoutを活用する。 *BNに対して効果は低く、補完程度の役割

一部修正

2021/10/10 00:23

投稿

スコア3266

answer CHANGED Viewed

@@ -2,7 +2,7 @@
 過学習の対策としては、以下が推奨されます。
-- データを増やす。  *後述するデータ拡張など
+- データを増やす。  *データ拡張を含む
 - モデルを単純化する（与えられた問題やデータに対して、モデルが複雑すぎる）。
 - データの汎用的な特徴を表現する特徴量選択を工夫したり、モデルを見直したりする。  *ResNetもその1つ
 - 大量の類似分野のデータで学習済のモデルを元に、転移学習やファインチューニングをする。
@@ -22,11 +22,6 @@
 今回は、質問者様のモデルのすべてのActivateionレイヤーの前にBatchNormalizationを追加しました。BatchNormalizationを入れる場合はDropoutを入れないほうが良いと言われていますが、ケースバイケースです。今回はDropoutはそのまま残しています。なお、バッチサイズを変更しましたが、本質的な違いではありません。
-これでも十分な結果だと思いますが、さらに精度を上げるには、以下のような打ち手が一般的ですので、試してみてください。
-- データ拡張
-- ResNetモデルの転移学習やファインチューニング
 最後に試したコードを示します。Colabで実行していますが、TPUを利用しているため、質問者様のコードからだいぶ変わっていると思います。
 ```Python

補足追記

2021/10/10 00:21

投稿

スコア3266

answer CHANGED Viewed

@@ -1,5 +1,15 @@
 結論としては、BatchNormalizationを適用するとうまくいくと思います。
+過学習の対策としては、以下が推奨されます。
+- データを増やす。  *後述するデータ拡張など
+- モデルを単純化する（与えられた問題やデータに対して、モデルが複雑すぎる）。
+- データの汎用的な特徴を表現する特徴量選択を工夫したり、モデルを見直したりする。  *ResNetもその1つ
+- 大量の類似分野のデータで学習済のモデルを元に、転移学習やファインチューニングをする。
+- BatchNormalizationを活用する。
+- Dropoutを活用する。 *BNに対して効果は低く、補完程度の役割
+- 正則化する。 *古い教科書には記述されているが、ほぼ絶滅した手法
 Cifar10のデータセットから5クラスを取り出して、質問者様のモデルを訓練してみました。
 - そのまま実行。loss = nan となって学習が進みません。

一部修正

2021/10/10 00:19

投稿

スコア3266

answer CHANGED Viewed

@@ -1,10 +1,12 @@
+結論としては、BatchNormalizationを適用するとうまくいくと思います。
 Cifar10のデータセットから5クラスを取り出して、質問者様のモデルを訓練してみました。
 - そのまま実行。loss = nan となって学習が進みません。
 - optimizerをAdamに変更。学習は進みますが、質問者様と同様に、過学習の傾向が出ます。
 - BatchNormalizationをモデルに追加。きれいに学習が進みます。
-結果はこちらです。
+結果はこちらです。質問者様と異なるデータセットを使っていますので、参考程度にしてください。
 ![イメージ説明](f9e6a2a91f4585fe88da72fefb3b1575.png)

一部修正

2021/10/09 04:16

投稿

スコア3266

answer CHANGED Viewed

@@ -28,12 +28,10 @@
 (x_train, y_train), (x_test, y_test) = cifar10.load_data()
 num = 5
-X_train = x_train[y_train[:,0] < num]
+X_train = x_train[y_train[:,0] < num].astype('float32') / 255.0
 y_train = to_categorical(y_train[y_train[:,0] < num], num).astype('float32')
-X_test = x_test[y_test[:,0] < num]
+X_test = x_test[y_test[:,0] < num].astype('float32') / 255.0
 y_test = to_categorical(y_test[y_test[:,0] < num], num).astype('float32')
-x_train = x_train.astype('float32') / 255.0
-x_test = x_test.astype('float32') / 255.0
 def create_model():
     model = Sequential()