質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

87.37%

Keras 画像の水増し後のオーギュメンテーションについて

受付中

回答 0

投稿

  • 評価
  • クリップ 1
  • VIEW 1,451

score 47

ローカルのディレクトリから画像を読み込んで、trainingとvalidationに分けた後でimagedatagenerationを使用したいのですが、どのようなコードに変えたらいいのか教えていただきたいです。

# coding:utf-8

import keras
from keras.utils import np_utils
from keras.layers.convolutional import Conv2D, MaxPooling2D
from keras.models import Sequential
from keras.layers.core import Dense, Dropout, Activation, Flatten
from keras.preprocessing.image import array_to_img, img_to_array, list_pictures, load_img
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
from sklearn.neighbors import KNeighborsClassifier

#【学習データの読み込み】
X = []
Y = []


ep = 30
size = 80,80

#a
for picture in list_pictures('/Users/train/a'):
    img = img_to_array(load_img(picture, target_size=(size)))
    X.append(img)

    Y.append(0)

#b
for picture in list_pictures('/Users/train/b'):
    img = img_to_array(load_img(picture, target_size=(size)))
    X.append(img)

    Y.append(1)


#c
for picture in list_pictures('/Users/train/c'):
    img = img_to_array(load_img(picture, target_size=(size)))
    X.append(img)

    Y.append(2)

# load_imgをarrayに変換
X = np.asarray(X)
Y = np.asarray(Y)


# 画素値を0から1の範囲に変換
X = X.astype('float32')
X = X / 255.0

# クラスの形式を変換
Y = np_utils.to_categorical(Y, 8)

# 学習用データとテストデータ
X_train, y_train= train_test_split(X, Y, test_size=0.2)

# 【CNNを構築】
model = Sequential()
#モデルを作るためのモジュール、モデル層を積み重ねたもの

model.add(Conv2D(32, (3, 3), padding='same',
                 input_shape=X_train.shape[1:]))
model.add(Activation('relu'))
model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.4))
model.add(Conv2D(64, (3, 3), padding='same'))
model.add(Activation('relu'))
model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.4))
model.add(Flatten())
model.add(Dense(512))
model.add(Activation('relu'))
model.add(Dropout(0.4))
model.add(Dense(8))
model.add(Activation('softmax'))

# 【コンパイル】
model.compile(loss='categorical_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

#【学習実行】
history = model.fit(X_train, y_train, batch_size=64, epochs=ep, verbose = 1)



model.save_weights('abc.weight.h5')

#【学習をグラフ表示】
%matplotlib inline
plt.plot(history.history['acc'])
plt.plot(history.history['val_acc'])
plt.xlabel('epoch')
plt.ylabel('accuracy')
plt.title('model accuracy')
plt.legend(['train', 'test'], loc='upper left')
plt.show()    
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.xlabel('epoch')
plt.ylabel('loss')
plt.title('model loss')
plt.legend(['loss', 'val_loss'], loc='upper left')
plt.show()

a.b.cの3カテゴリーに計300枚の画像が入っているとした時に
test_split=0.2でtrain=240枚、validation=60枚に分け、その後で
オーギュメンテーションをして1枚の画像から5枚の水増し画像を生成したいです。

結果的にtrain=1200枚、validation=300枚で学習をスタートさせ、最終的に
testカテゴリに入っている自分が選択した画像でtestを行いたいです

オーギュメンテーションの組み込み方がわからないので、ご教授頂きたいです。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正の依頼

  • Q71

    2019/07/06 08:59

    水増しと学習を同じコードで行おうとしている様ですが、分けた方がいいと思います。

    キャンセル

  • 22Go

    2019/07/06 11:47

    そうなんですか。読み込むデータが多くなりすぎるからでしょうか?
    では、事前にtrain-vali-testにディレクトリで分けてから学習する方がいいのでしょうか?

    キャンセル

まだ回答がついていません

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 87.37%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る