質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.12%

kerasでディープラーニングを行う際、2回に分けて学習され、時間がかかってしまう。

受付中

回答 0

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 349

dragon1

score 6

kerasでディープラーニングを行う際、以前は以下のように、1回でまとめて学習できていたのですが、

Epoch 1/20
54000/54000 [==============================] - 3s - loss: 1.0019 - acc: 0.8119 - val_loss: 0.8717 - val_acc: 0.8598
Epoch 2/20
54000/54000 [==============================] - 3s - loss: 0.8861 - acc: 0.8243 - val_loss: 0.7685 - val_acc: 0.8712


少しコードをいじってしまったところ、元に戻しても以下のように2回に分けて学習されるようになってしまいました。
これはなぜなのでしょうか?
変更箇所

class_mode="categorical",
から
class_mode="sparse",
に変更しました。

イメージ説明

以下、該当コードです。

import os
import matplotlib.pyplot as plt
import numpy as np
from tensorflow.keras.applications.vgg16 import VGG16, preprocess_input
from tensorflow.keras.layers import Dense, Dropout, Flatten
from tensorflow.keras.models import Sequential
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.utils import get_file

num_classes = 2  # クラス数

# VGG16 モデルを作成する。
vgg16 = VGG16(include_top=False, weights = "imagenet",  input_shape=(224, 224, 3))

vgg16.trainable = False  # 重みをフリーズする。

model = Sequential(
    [
        vgg16,
        Flatten(),
        Dense(500, activation="relu"),
        Dropout(0.5),
        Dense(500, activation="relu"),
        Dropout(0.5),
        Dense(num_classes, activation="softmax"),
    ]
)

model.summary()

# コンパイル
model.compile(
    optimizer="adam", loss="sparse_categorical_crossentropy", metrics=["accuracy"]
)

# ハイパーパラメータ
batch_size = 100  # バッチサイズ
num_epochs = 35  # エポック数

# ImageDataGenerator を作成する。
datagen_params = {
    "preprocessing_function": preprocess_input,
    "horizontal_flip": True,
    "brightness_range": (0.7, 1.3),
    "validation_split": 0.2,
}

datagen = ImageDataGenerator(**datagen_params)
# dataset_dir
dataset_dir = '/content/drive/My Drive/Colab Notebooks/imgs/animal_images/train/'
# test_dataset_dir = '/content/drive/My Drive/Colab Notebooks/imgs/sushi/test_images/'

# 学習データを生成するジェネレーターを作成する。
train_generator = datagen.flow_from_directory(
    dataset_dir,
    target_size=(224, 224),
    batch_size=batch_size,
    class_mode="sparse",
    subset="training"
)

# バリデーションデータを生成するジェネレーターを作成する。
val_generator = datagen.flow_from_directory(
    dataset_dir,
    target_size=(224, 224),
    batch_size=batch_size,
    class_mode="sparse",
    subset="validation",
)

# クラス ID とクラス名の対応関係
print(train_generator.class_indices)

# 学習する。
history = model.fit_generator(
    train_generator,
    steps_per_epoch=train_generator.samples // batch_size,
    validation_data=val_generator,
    validation_steps=val_generator.samples // batch_size,
    epochs=num_epochs,
)

epochs = np.arange(1, num_epochs + 1)
fig, [ax1, ax2] = plt.subplots(1, 2, figsize=(10, 4))

# 損失関数の履歴を可視化する。
ax1.plot(epochs, history.history["loss"], label="loss")
ax1.plot(epochs, history.history["val_loss"], label="validation loss")
ax1.set_xlabel("epochs")
ax1.legend()

# 精度の履歴を可視化する。       
ax2.plot(epochs, history.history["acc"], label="accuracy")
ax2.plot(epochs, history.history["val_acc"], label="validation accuracy")
ax2.set_xlabel("epochs")
ax2.legend()

plt.show()

# 評価する。
test_loss, test_acc = model.evaluate_generator(val_generator)
print(f"test loss: {test_loss:.2f}, test accuracy: {test_acc:.2%}")

試したこと

(-)model.compile(
(-)    optimizer="adam", loss="sparse_categorical_crossentropy", metrics=["accuracy"]
(-))

(+)model.compile(
(+)    optimizer="adam", loss="categorical_crossentropy", metrics=["accuracy"]
(+))
(-)    class_mode="sparse",
(+)    class_mode="categorical",


これらを試してみたのですが、特に変わったことはありませんでした。
以上、よろしくお願い致します。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正の依頼

  • coco_bauer

    2019/10/15 12:14

    コードのどの部分を、どのように、いじったのですか?

    キャンセル

  • dragon1

    2019/10/15 12:24

    ```
    datagen_params = {
    "preprocessing_function": preprocess_input,
    "horizontal_flip": True,
    "brightness_range": (0.7, 1.3),
    "validation_split": 0.2,
    }
    ```
    の中身を修正しただけです。

    キャンセル

  • dragon1

    2019/10/15 12:45

    あと、
    class_mode="categorical",
    から
    class_mode="sparse",
    に変更しました。

    キャンセル

まだ回答がついていません

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.12%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る